发布文献求助

UATVR: Uncertainty-Adaptive Text-Video Retrieval

计算机科学嵌入概率逻辑编码器情报检索匹配（统计）语义学（计算机科学）编码（集合论）人工智能情态动词自然语言处理程序设计语言操作系统统计集合（抽象数据类型）化学高分子化学数学

作者

Bo Fang,Wenhao Wu,Chang Liu,Yu Zhou,Yuxin Song,Weiping Wang,Xiangbo Shu,Xiangyang Ji,Jingdong Wang

标识

DOI：10.1109/iccv51070.2023.01262

摘要

With the explosive growth of web videos and emerging large-scale vision-language pre-training models, e.g., CLIP, retrieving videos of interest with text instructions has attracted increasing attention. A common practice is to transfer text-video pairs to the same embedding space and craft cross-modal interactions with certain entities in specific granularities for semantic correspondence. Unfortunately, the intrinsic uncertainties of optimal entity combinations in appropriate granularities for cross-modal queries are understudied, which is especially critical for modalities with hierarchical semantics, e.g., video, text, etc. In this paper, we propose an Uncertainty-Adaptive Text-Video Retrieval approach, termed UATVR, which models each lookup as a distribution matching procedure. Concretely, we add additional learnable tokens in the encoders to adaptively aggregate multi-grained semantics for flexible high-level reasoning. In the refined embedding space, we represent text-video pairs as probabilistic distributions where prototypes are sampled for matching evaluation. Comprehensive experiments on four benchmarks justify the superiority of our UATVR, which achieves new state-of-the-art results on MSR-VTT (50.8%), VATEX (64.5%), MSVD (49.7%), and DiDeMo (45.8%). The code is available at https://github.com/bofang98/UATVR.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

📰 新增『新锐期刊分区』 (2026-3-24)

更新

💬 新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒 每天60秒读懂世界·精选全球要闻 (2026-1-2)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 刘霁葳完成签到，获得积分10

刚刚; 泥嚎完成签到，获得积分10

4秒前; 香蕉新儿完成签到，获得积分10

9秒前; hj完成签到，获得积分10

10秒前; pengyh8完成签到，获得积分10

15秒前; 秦兴虎完成签到，获得积分10

16秒前; Kiry完成签到，获得积分10

19秒前; 程志强完成签到，获得积分10

21秒前; 隐形曼青上传了应助文件

25秒前; 炫技且谦虚发布了新的文献求助10

33秒前; 术语完成签到，获得积分10

36秒前; 12305014077完成签到，获得积分10

36秒前; 你好你好完成签到，获得积分10

39秒前; 搜集达人的应助被炫技且谦虚采纳，获得10

40秒前; luckydog完成签到，获得积分10

43秒前; MADAO完成签到，获得积分10

46秒前; 伊戈达拉一个大拉完成签到，获得积分10

49秒前; 时尚之卉完成签到，获得积分10

49秒前; stiger完成签到，获得积分0

51秒前; 科研通AI2S上传了应助文件

57秒前; 开心的盼波完成签到，获得积分10

58秒前; 美好闭月完成签到，获得积分10

1分钟前; yuxi2025完成签到，获得积分10

1分钟前; wmz完成签到，获得积分10

1分钟前; CY完成签到，获得积分10

1分钟前; 刘霁葳发布了新的文献求助10

1分钟前; 爱我不上火完成签到，获得积分10

1分钟前; 今后的应助被给我烤咸鱼采纳，获得30

1分钟前; 壮观的谷冬完成签到，获得积分0

1分钟前; 针真滴完成签到，获得积分10

1分钟前; 生动梦松驳回了学术文献互助的应助

1分钟前; 海盗船长完成签到，获得积分10

1分钟前; 打你完成签到，获得积分10

1分钟前; aikeyan完成签到，获得积分10

1分钟前; 星星完成签到，获得积分10

1分钟前; hhh完成签到，获得积分10

1分钟前; Ellen完成签到，获得积分10

1分钟前; Joy完成签到，获得积分10

1分钟前; 搜集达人上传了应助文件

1分钟前; 翰飞寰宇完成签到，获得积分10

1分钟前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500; 卤化钙钛矿人工突触的研究 2000; Моделирование процессов самоорганизации в кристаллообразующих системах 1000; History of U.S. Space Surveillance and Satellite Cataloging 1000; Malcolm Fraser : a biography 700; Signals, Systems, and Signal Processing 610

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 6508361; 求助须知：如何正确求助？哪些是违规求助？ 8301342; 关于积分的说明 17721606; 捐赠科研通 5609070; 什么是DOI，文献DOI怎么找？ 2921735; 邀请新用户注册赠送积分活动 1898941; 关于科研通互助平台的介绍 1761544

今日热心研友

贪玩的秋柔

学术文献互助

AllRightReserved

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通