亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Transformer based 6DoF Pose Estimation for Visual SLAM

卷积神经网络 人工智能 计算机科学 分割 变压器 姿势 计算机视觉 特征(语言学) 模式识别(心理学) 特征学习 工程类 电压 语言学 哲学 电气工程
作者
Jae-Min Chae,Soo-Chahn Lee
出处
期刊:Jeonja gonghakoe nonmunji(2012) [The Institute of Electronics Engineers of Korea]
卷期号:58 (12): 49-56
标识
DOI:10.5573/ieie.2021.58.12.49
摘要

본 논문에서는 비전 트랜스포머(Vision Transformer, ViT)와 합성곱 신경망(Convolution Neural Network, CNN) 구조를 결합한 하이브리드 네트워크를 사용하여 단안 카메라 자세 추정을 위한 비지도 학습 기법을 제안한다. 분류(Classification) 및 분할(Segmentation) 분야에서 최고의 성능을 보여주는 ViT에 영감을 받아서 단안 카메라 자세 추정 문제에 대해 추론하는 부분인 ViT와 Feature를 생성하는 부분인 CNN을 결합하였다. CNN을 통해 생성된 Feature들을 일정한 크기의 패치들로 분할하고 분할된 각 패치들간의 연관성을 ViT의 Self-Attention 연산을 통해 계산하였다. 이때 기존의 ViT와 달리 Self-Attention 연산을 적용 시 패치들의 차원을 점진적으로 축소하여 Self-Attention의 연산량을 감소시켰다. 최종적으로 두 프레임간의 이동, 회전 정보인 6개의 추정값 6DoF를 얻도록 하였다. 실험을 통해 대부분 컨볼루션 층으로만 구성된 이전 CNN 구조와 비교하여 하이브리드 네트워크를 적용하였을 때 성능향상이 있음을 증명하였다. 본 논문은 카메라 자세 추정 문제에 대해 트랜스포머 네트워크와 Self-Attention기반 기법들이 응용될 수 있는 잠재성을 보인다.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI6.2应助大气凝云采纳,获得10
1秒前
闲鱼电脑完成签到,获得积分10
1秒前
4秒前
10秒前
米饭儿发布了新的文献求助10
11秒前
loii应助科研通管家采纳,获得20
15秒前
11完成签到,获得积分10
15秒前
19秒前
wcwpl发布了新的文献求助10
20秒前
晴子发布了新的文献求助10
22秒前
23秒前
涛1完成签到 ,获得积分10
23秒前
卡拉肖克攀完成签到 ,获得积分10
24秒前
xzh发布了新的文献求助10
27秒前
il发布了新的文献求助10
29秒前
姜鹏完成签到,获得积分20
30秒前
31秒前
彭于晏应助曾经的音响采纳,获得10
36秒前
欢喜的花卷完成签到,获得积分10
37秒前
激动的海豚完成签到 ,获得积分10
38秒前
狡猾的夫完成签到 ,获得积分10
39秒前
Brenna完成签到 ,获得积分10
39秒前
科研通AI6.2应助xiuwenli采纳,获得10
40秒前
42秒前
wcwpl完成签到,获得积分10
42秒前
45秒前
46秒前
小巧的花生完成签到,获得积分10
48秒前
49秒前
xiuwenli发布了新的文献求助10
55秒前
1分钟前
倒立拉shi发布了新的文献求助10
1分钟前
1分钟前
1分钟前
oopsabc完成签到,获得积分10
1分钟前
1分钟前
假真真完成签到 ,获得积分10
1分钟前
共享精神应助EBsisyphs采纳,获得10
1分钟前
1分钟前
晴子发布了新的文献求助10
1分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Cold War Transcended: Australia's China Policy, 1949-1990 998
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
Testimonial Injustice and Trust 510
Fundamentals of Body MRI 3rd Edition 400
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6632685
求助须知:如何正确求助?哪些是违规求助? 8392715
关于积分的说明 17951198
捐赠科研通 5813988
什么是DOI,文献DOI怎么找? 2965314
邀请新用户注册赠送积分活动 1940475
关于科研通互助平台的介绍 1852187