亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Cross-Level Multi-Modal Features Learning With Transformer for RGB-D Object Recognition

人工智能 计算机科学 计算机视觉 RGB颜色模型 三维单目标识别 判别式 特征提取 视觉对象识别的认知神经科学 模式识别(心理学) 卷积神经网络
作者
Ying Zhang,Maoliang Yin,Heyong Wang,Changchun Hua
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:33 (12): 7121-7130 被引量:6
标识
DOI:10.1109/tcsvt.2023.3275814
摘要

Object recognition, one of the main goals of robot vision, is a vital prerequisite for service robots to perform domestic tasks. Thanks to the rich sense of information provided by RGB-D sensors, RGB-D-based object recognition has received increasing attention. However, the existing works focus on collaborative RGB and depth data for object recognition, while ignoring the influence of depth image quality on recognition performance. Moreover, in real-world scenarios, there are many objects with strong similarity from certain observation angles, which poses a challenge for the service robot to recognize objects accurately. In this paper, we propose CNN-TransNet, a novel end-to-end Transformer-based architecture with convolutional neural networks (CNNs) for RGB-D object recognition. In order to deal with the effect of high inter-class similarity, discriminative multi-modal feature representations are generated by learning and relating multi-modal features at multiple levels. Besides, we employ a multi-modal fusion and projection (MMFP) module to reweight the contribution of each modality to address the problem of poor-quality depth image. Our proposed approach achieves state-of-the-art performance on three datasets (including Washington RGB-D Object Dataset, JHUIT-50, and Object Clutter Indoor Dataset), with accuracy of 95.4%, 98.1%, and 94.7%, respectively. The results demonstrate the effectiveness and superiority of the proposed model in RGB-D object recognition task.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
是木易呀完成签到,获得积分10
11秒前
Lucas应助科研通管家采纳,获得10
54秒前
科研通AI2S应助科研通管家采纳,获得10
55秒前
1分钟前
1分钟前
7NEFZ发布了新的文献求助10
1分钟前
迅速的蜡烛完成签到 ,获得积分10
1分钟前
7NEFZ完成签到,获得积分20
1分钟前
ppppppp_76完成签到 ,获得积分10
2分钟前
豌豆发布了新的文献求助10
2分钟前
2分钟前
山橘月发布了新的文献求助10
2分钟前
漠mo完成签到 ,获得积分10
3分钟前
可爱的函函应助万晓博采纳,获得30
3分钟前
科研通AI5应助7NEFZ采纳,获得10
4分钟前
4分钟前
7NEFZ发布了新的文献求助10
4分钟前
万能图书馆应助wang采纳,获得30
4分钟前
4分钟前
133发布了新的文献求助10
4分钟前
dormraider完成签到,获得积分10
4分钟前
wang完成签到,获得积分10
5分钟前
澄碧千顷完成签到 ,获得积分10
5分钟前
5分钟前
5分钟前
wang发布了新的文献求助30
5分钟前
chenwuhao完成签到 ,获得积分10
5分钟前
函数完成签到 ,获得积分10
6分钟前
6分钟前
MizuAsagi发布了新的文献求助50
7分钟前
重要问芙brk完成签到,获得积分10
7分钟前
7分钟前
zzzwhy发布了新的文献求助10
8分钟前
Ava应助11采纳,获得10
8分钟前
汉堡包应助11采纳,获得10
8分钟前
科研通AI5应助迷路枫采纳,获得10
8分钟前
8分钟前
zzzwhy完成签到,获得积分20
8分钟前
迷路枫发布了新的文献求助10
8分钟前
在水一方应助JY采纳,获得10
8分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
A China diary: Peking 400
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3784795
求助须知:如何正确求助?哪些是违规求助? 3330055
关于积分的说明 10244188
捐赠科研通 3045395
什么是DOI,文献DOI怎么找? 1671660
邀请新用户注册赠送积分活动 800577
科研通“疑难数据库(出版商)”最低求助积分说明 759508