清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Text-based Person Search without Parallel Image-Text Data

隐藏字幕 计算机科学 图像(数学) 集合(抽象数据类型) 语言模型 自然语言 人工智能 方案(数学) 图像检索 情报检索 自然语言处理 数学分析 数学 程序设计语言
作者
Bai Yang,Jingyao Wang,Min Cao,Chen Chen,Zhigang Cao,Liqiang Nie,Min Zhang
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2305.12964
摘要

Text-based person search (TBPS) aims to retrieve the images of the target person from a large image gallery based on a given natural language description. Existing methods are dominated by training models with parallel image-text pairs, which are very costly to collect. In this paper, we make the first attempt to explore TBPS without parallel image-text data ($\mu$-TBPS), in which only non-parallel images and texts, or even image-only data, can be adopted. Towards this end, we propose a two-stage framework, generation-then-retrieval (GTR), to first generate the corresponding pseudo text for each image and then perform the retrieval in a supervised manner. In the generation stage, we propose a fine-grained image captioning strategy to obtain an enriched description of the person image, which firstly utilizes a set of instruction prompts to activate the off-the-shelf pretrained vision-language model to capture and generate fine-grained person attributes, and then converts the extracted attributes into a textual description via the finetuned large language model or the hand-crafted template. In the retrieval stage, considering the noise interference of the generated texts for training model, we develop a confidence score-based training scheme by enabling more reliable texts to contribute more during the training. Experimental results on multiple TBPS benchmarks (i.e., CUHK-PEDES, ICFG-PEDES and RSTPReid) show that the proposed GTR can achieve a promising performance without relying on parallel image-text data.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
秋夜临完成签到,获得积分0
6秒前
howudoin完成签到,获得积分10
14秒前
邹醉蓝完成签到,获得积分0
14秒前
娟子完成签到,获得积分10
22秒前
drhwang完成签到,获得积分10
28秒前
zzz完成签到,获得积分10
33秒前
三日完成签到 ,获得积分10
38秒前
早晚会疯完成签到 ,获得积分10
50秒前
胡国伦完成签到 ,获得积分10
59秒前
1分钟前
秦婉琦发布了新的文献求助10
1分钟前
zz0429完成签到 ,获得积分10
1分钟前
saywhy完成签到 ,获得积分10
1分钟前
党文英发布了新的文献求助10
1分钟前
JADE发布了新的文献求助30
1分钟前
Sthool完成签到,获得积分10
1分钟前
党文英完成签到,获得积分10
1分钟前
elisa828发布了新的文献求助20
2分钟前
我是老大应助科研通管家采纳,获得10
4分钟前
香蕉觅云应助elisa828采纳,获得10
4分钟前
zhuosht完成签到 ,获得积分10
4分钟前
elisa828完成签到,获得积分10
5分钟前
gwbk完成签到,获得积分10
5分钟前
合适的如天完成签到,获得积分10
5分钟前
怕孤单的棒棒糖完成签到 ,获得积分10
5分钟前
特特雷珀萨努完成签到 ,获得积分10
5分钟前
film完成签到 ,获得积分10
5分钟前
日光倾城完成签到 ,获得积分10
5分钟前
kmzzy完成签到,获得积分10
6分钟前
JADE发布了新的文献求助10
6分钟前
隶书完成签到,获得积分10
7分钟前
Lidanni完成签到 ,获得积分10
7分钟前
幸福胡萝卜完成签到,获得积分10
7分钟前
分析完成签到 ,获得积分10
7分钟前
小西完成签到 ,获得积分0
7分钟前
忘忧Aquarius完成签到,获得积分10
7分钟前
7分钟前
苗苗完成签到 ,获得积分10
7分钟前
spinon完成签到,获得积分10
7分钟前
Sunny发布了新的文献求助10
8分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de guyane 2500
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
《The Emergency Nursing High-Yield Guide》 (或简称为 Emergency Nursing High-Yield Essentials) 500
The Dance of Butch/Femme: The Complementarity and Autonomy of Lesbian Gender Identity 500
Differentiation Between Social Groups: Studies in the Social Psychology of Intergroup Relations 350
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5881036
求助须知:如何正确求助?哪些是违规求助? 6581773
关于积分的说明 15690661
捐赠科研通 5000990
什么是DOI,文献DOI怎么找? 2694533
邀请新用户注册赠送积分活动 1636726
关于科研通互助平台的介绍 1593713