亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object Detection

计算机科学 情态动词 自然语言处理 人工智能 词汇 目标检测 语境分析 背景(考古学) 机器学习 语言学 模式识别(心理学) 化学 高分子化学 古生物学 哲学 政府(语言学) 生物
作者
Yifan Xu,Mengdan Zhang,Xiaoshan Yang,Changsheng Xu
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2308.15846
摘要

In this paper, we for the first time explore helpful multi-modal contextual knowledge to understand novel categories for open-vocabulary object detection (OVD). The multi-modal contextual knowledge stands for the joint relationship across regions and words. However, it is challenging to incorporate such multi-modal contextual knowledge into OVD. The reason is that previous detection frameworks fail to jointly model multi-modal contextual knowledge, as object detectors only support vision inputs and no caption description is provided at test time. To this end, we propose a multi-modal contextual knowledge distillation framework, MMC-Det, to transfer the learned contextual knowledge from a teacher fusion transformer with diverse multi-modal masked language modeling (D-MLM) to a student detector. The diverse multi-modal masked language modeling is realized by an object divergence constraint upon traditional multi-modal masked language modeling (MLM), in order to extract fine-grained region-level visual contexts, which are vital to object detection. Extensive experiments performed upon various detection datasets show the effectiveness of our multi-modal context learning strategy, where our approach well outperforms the recent state-of-the-art methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
JamesPei应助谦让的西装采纳,获得10
9秒前
小b亮完成签到,获得积分10
15秒前
XHMM完成签到,获得积分10
22秒前
32秒前
李健应助真实的青旋采纳,获得10
32秒前
哭泣灯泡完成签到,获得积分10
33秒前
37秒前
爱撒娇的妙竹完成签到,获得积分10
40秒前
histamin完成签到,获得积分10
46秒前
英俊的铭应助ROC采纳,获得10
59秒前
打打应助念安采纳,获得10
1分钟前
马马完成签到,获得积分10
1分钟前
1分钟前
TTchen关注了科研通微信公众号
1分钟前
linzw发布了新的文献求助10
1分钟前
爆米花应助大气大侠采纳,获得10
1分钟前
胸神恶煞完成签到 ,获得积分10
1分钟前
威武灵阳完成签到,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
CodeCraft应助tingtingzhang采纳,获得10
1分钟前
马马发布了新的文献求助20
1分钟前
1分钟前
OsamaKareem应助科研通管家采纳,获得10
1分钟前
1分钟前
XYFQS完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
念安发布了新的文献求助10
1分钟前
1分钟前
海洋完成签到 ,获得积分10
2分钟前
调皮翅膀完成签到 ,获得积分10
2分钟前
yue应助ceeray23采纳,获得20
2分钟前
科研通AI6.3应助黄莉采纳,获得10
2分钟前
2分钟前
科研通AI6.3应助很多熏熏采纳,获得10
2分钟前
天天快乐应助念安采纳,获得10
2分钟前
ROC发布了新的文献求助10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6399099
求助须知:如何正确求助?哪些是违规求助? 8214540
关于积分的说明 17407279
捐赠科研通 5452414
什么是DOI,文献DOI怎么找? 2881737
邀请新用户注册赠送积分活动 1858260
关于科研通互助平台的介绍 1700114