已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

SMTDKD: A Semantic-Aware Multimodal Transformer Fusion Decoupled Knowledge Distillation Method for Action Recognition

计算机科学 可穿戴计算机 传感器融合 人工智能 变压器 稳健性(进化) 卷积神经网络 机器学习 特征提取 模式识别(心理学) 工程类 化学 电压 嵌入式系统 电气工程 基因 生物化学
作者
Zhenzhen Quan,Qingshan Chen,Wei Wang,Moyan Zhang,Xiang Li,Yujun Li,Zhi Liu
出处
期刊:IEEE Sensors Journal [IEEE Sensors Council]
卷期号:24 (2): 2289-2304
标识
DOI:10.1109/jsen.2023.3337367
摘要

Multimodal sensors, including vision sensors and wearable sensors, offer valuable complementary information for accurate recognition tasks. Nonetheless, the heterogeneity among sensor data from different modalities presents a formidable challenge in extracting robust multimodal information amidst noise. In this paper, we propose an innovative approach, named semantic-aware multimodal transformer fusion decoupled knowledge distillation method (SMTDKD), which not only guides video data recognition through the information interaction between different wearable-sensor data, but also through the information interaction between visual sensor data and wearable-sensor data, improving the robustness of the model. To preserve the temporal relationship within wearable-sensor data, the SMTDKD method converts them into 2D image data. Furthermore, a transformer-based multimodal fusion module is designed to capture diverse feature information from distinct wearable-sensor modalities. To mitigate modality discrepancies and encourage similar semantic features, graph cross-view attention maps are constructed across various convolutional layers to facilitate feature alignment. Additionally, semantic information is exchanged among the teacher-student network, the student network, and BERT-encoded labels. To obtain more comprehensive knowledge transfer, the decoupled knowledge distillation loss is utilized, thereby enhancing the generalization of the network. Experimental evaluations conducted on three multimodal datasets, namely UTD-MHAD, Berkeley-MHAD, and MMAct, demonstrate the superior performance of the proposed SMTDKD method over the state-of-the-art action human recognition methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
鹿梦完成签到,获得积分10
4秒前
车干完成签到 ,获得积分10
5秒前
鱼贝贝完成签到 ,获得积分10
7秒前
科研通AI2S应助zz采纳,获得10
9秒前
13秒前
13秒前
echo发布了新的文献求助10
15秒前
黄h完成签到,获得积分10
15秒前
16秒前
17秒前
星辰大海发布了新的文献求助10
21秒前
姓张发布了新的文献求助10
22秒前
zwenng发布了新的文献求助10
22秒前
22秒前
23秒前
研研发布了新的文献求助10
24秒前
24秒前
Sevi完成签到,获得积分10
26秒前
omega发布了新的文献求助30
29秒前
31秒前
姓张完成签到,获得积分20
32秒前
英姑应助Lyra采纳,获得10
34秒前
专注的胡萝卜完成签到 ,获得积分0
36秒前
LIKO完成签到,获得积分10
39秒前
lululu完成签到 ,获得积分10
39秒前
白泽完成签到,获得积分10
40秒前
笔墨稠发布了新的文献求助10
41秒前
穆清发布了新的文献求助10
42秒前
顾矜应助morena采纳,获得10
44秒前
宗帝完成签到 ,获得积分10
45秒前
46秒前
酷酷班完成签到,获得积分10
46秒前
46秒前
CipherSage应助勇往直前采纳,获得10
51秒前
梦自然完成签到 ,获得积分10
52秒前
53秒前
小兵发布了新的文献求助10
53秒前
寒冷的电脑完成签到 ,获得积分10
53秒前
五邑大学完成签到 ,获得积分10
54秒前
chensihao发布了新的文献求助10
56秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
The Study of Hand-Illumination and Woodcut Illustration in Italian Incunabula, 1960s -2020: Historiography and a Memoir 500
Petrology and Plate Tectonics 500
Writing Systems 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6887573
求助须知:如何正确求助?哪些是违规求助? 8585659
关于积分的说明 18237912
捐赠科研通 6277006
什么是DOI,文献DOI怎么找? 3057597
关于科研通互助平台的介绍 2071263
邀请新用户注册赠送积分活动 2035185