SignBERT+: Hand-Model-Aware Self-Supervised Pre-Training for Sign Language Understanding

计算机科学 可解释性 手语 人工智能 手势 语言模型 安全性令牌 机器学习 深度学习 哲学 计算机安全 语言学
作者
Hezhen Hu,Weichao Zhao,Wengang Zhou,Houqiang Li
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:45 (9): 11221-11239 被引量:120
标识
DOI:10.1109/tpami.2023.3269220
摘要

Hand gesture serves as a crucial role during the expression of sign language. Current deep learning based methods for sign language understanding (SLU) are prone to over-fitting due to insufficient sign data resource and suffer limited interpretability. In this paper, we propose the first self-supervised pre-trainable SignBERT+ framework with model-aware hand prior incorporated. In our framework, the hand pose is regarded as a visual token, which is derived from an off-the-shelf detector. Each visual token is embedded with gesture state and spatial-temporal position encoding. To take full advantage of current sign data resource, we first perform self-supervised learning to model its statistics. To this end, we design multi-level masked modeling strategies (joint, frame and clip) to mimic common failure detection cases. Jointly with these masked modeling strategies, we incorporate model-aware hand prior to better capture hierarchical context over the sequence. After the pre-training, we carefully design simple yet effective prediction heads for downstream tasks. To validate the effectiveness of our framework, we perform extensive experiments on three main SLU tasks, involving isolated and continuous sign language recognition (SLR), and sign language translation (SLT). Experimental results demonstrate the effectiveness of our method, achieving new state-of-the-art performance with a notable gain.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
北枳完成签到,获得积分10
2秒前
sy发布了新的文献求助10
4秒前
6秒前
文献快来完成签到 ,获得积分10
11秒前
13秒前
无语的麦片完成签到 ,获得积分10
14秒前
华仔应助yrc采纳,获得10
15秒前
谢陈完成签到 ,获得积分0
16秒前
想吃芝士荔枝烤鱼完成签到,获得积分10
17秒前
大象放冰箱完成签到,获得积分10
17秒前
1爱3发布了新的文献求助10
17秒前
风清扬发布了新的文献求助10
18秒前
cangmingzi完成签到,获得积分10
20秒前
cangmingzi完成签到,获得积分10
20秒前
韦诗涵完成签到,获得积分10
23秒前
的服务费完成签到,获得积分10
25秒前
26秒前
27秒前
YiyueChan完成签到,获得积分10
27秒前
强健的水云完成签到,获得积分10
29秒前
一条小鱼完成签到,获得积分10
37秒前
xuejingling应助YXL采纳,获得10
39秒前
JamesPei应助3152采纳,获得10
41秒前
Orange应助浮浮世世采纳,获得10
41秒前
lulu发布了新的文献求助300
43秒前
43秒前
刘成完成签到,获得积分10
45秒前
渔渔完成签到 ,获得积分10
45秒前
yao完成签到,获得积分10
47秒前
王丹靖完成签到 ,获得积分10
48秒前
沙滩的收印完成签到,获得积分10
49秒前
50秒前
搜集达人应助柚屿采纳,获得10
50秒前
emilia发布了新的文献求助10
50秒前
haohaohao完成签到,获得积分20
51秒前
赘婿应助qiu采纳,获得10
51秒前
YXL给YXL的求助进行了留言
52秒前
科研通AI6.1应助郭竞阳采纳,获得10
53秒前
zero完成签到,获得积分10
55秒前
拼豆豆应助科研通管家采纳,获得20
56秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Dr. Dirk Wiechmann on Lingual Orthodontics: Part I 888
Ideology and Meaning-Making under the Putin Regime 750
化工技术经济第五版电子版 500
Petrology and Plate Tectonics 500
Writing Systems 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6880529
求助须知:如何正确求助?哪些是违规求助? 8580181
关于积分的说明 18229959
捐赠科研通 6263549
什么是DOI,文献DOI怎么找? 3055054
关于科研通互助平台的介绍 2065338
邀请新用户注册赠送积分活动 2032715