DCEL: Deep Cross-modal Evidential Learning for Text-Based Person Retrieval

计算机科学 人工智能 情态动词 变化(天文学) 相似性(几何) 班级(哲学) 一般化 机器学习 深度学习 模式识别(心理学) 图像(数学) 数学 物理 数学分析 天体物理学 化学 高分子化学
作者
Shenshen Li,Xing Xu,Yang Yang,Fumin Shen,Yijun Mo,Y. Li,Heng Tao Shen
标识
DOI:10.1145/3581783.3612244
摘要

Text-based person retrieval aims at searching for a pedestrian image from multiple candidates with textual descriptions. It is challenging due to uncertain cross-modal alignments caused by the large intra-class variations. To address the challenge, most existing approaches rely on various attention mechanisms and auxiliary information, yet still struggle with the uncertain cross-modal alignments arising from significant intra-class variation, leading to coarse retrieval results. To this end, we propose a novel framework termed Deep Cross-modal Evidential Learning (DCEL), which deploys evidential deep learning to consider the cross-modal alignment uncertainty. Our DCEL model comprises three components: (1) Bidirectional Evidential Learning, which models alignment uncertainty to measure and mitigate the influence of large intra-class variation; (2) Multi-level Semantic Alignment, which leverages a proposed Semantic Filtration module and image-text similarity distribution to facilitate cross-modal alignments; (3) Cross-modal Relation Learning, which reasons about latent correspondences between multi-level tokens of image and text. Finally, we integrate the advantages of the three proposed components to enhance the model to achieve reliable cross-modal alignments. Our DCEL method consistently outperforms more than ten state-of-the-art methods in supervised, weakly supervised, and domain generalization settings on three benchmarks: CUHK-PEDES, ICFG-PEDES, and RSTPReid.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小贾同学完成签到,获得积分10
刚刚
li发布了新的文献求助10
刚刚
自由的面包完成签到,获得积分10
刚刚
Miyya完成签到 ,获得积分10
2秒前
王佳豪发布了新的文献求助10
2秒前
2秒前
细心灭龙发布了新的文献求助10
2秒前
nonTUT发布了新的文献求助10
3秒前
Orange应助joleisalau采纳,获得10
5秒前
6秒前
求泉发布了新的文献求助10
7秒前
烟花应助nonTUT采纳,获得10
9秒前
韩小小发布了新的文献求助10
10秒前
kk完成签到,获得积分10
11秒前
要减肥的惜萱完成签到,获得积分10
11秒前
Jasper应助自信的冬日采纳,获得10
12秒前
12秒前
12秒前
li完成签到,获得积分20
13秒前
zhiyu完成签到,获得积分10
15秒前
不倦应助活泼寻梅采纳,获得10
16秒前
我我我发布了新的文献求助10
17秒前
17秒前
搜集达人应助陈龙111111采纳,获得10
17秒前
阿萌完成签到 ,获得积分10
21秒前
脑洞疼应助诚心寄凡采纳,获得10
23秒前
23秒前
23秒前
25秒前
26秒前
26秒前
香蕉觅云应助曾经的凝丝采纳,获得10
27秒前
29秒前
陈龙111111发布了新的文献求助10
31秒前
xiaofeng应助吹球球8采纳,获得10
31秒前
科研通AI5应助夏一苒采纳,获得10
32秒前
32秒前
36秒前
思源应助玛卡巴卡采纳,获得10
37秒前
求泉完成签到,获得积分10
38秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778270
求助须知:如何正确求助?哪些是违规求助? 3323870
关于积分的说明 10216436
捐赠科研通 3039122
什么是DOI,文献DOI怎么找? 1667788
邀请新用户注册赠送积分活动 798409
科研通“疑难数据库(出版商)”最低求助积分说明 758366