亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multimodal Isotropic Neural Architecture with Patch Embedding

计算机科学 嵌入 卷积神经网络 人工智能 变压器 模式识别(心理学) 建筑 可扩展性 计算机工程 数据库 量子力学 物理 艺术 视觉艺术 电压
作者
Hubert Truchan,Evgenii Naumov,Rezaul Abedin,Gregory Palmer,Zahra Ahmadi
出处
期刊:Lecture Notes in Computer Science 卷期号:: 173-187 被引量:2
标识
DOI:10.1007/978-981-99-8079-6_14
摘要

Patch embedding has been a significant advancement in Transformer-based models, particularly the Vision Transformer (ViT), as it enables handling larger image sizes and mitigating the quadratic runtime of self-attention layers in Transformers. Moreover, it allows for capturing global dependencies and relationships between patches, enhancing effective image understanding and analysis. However, it is important to acknowledge that Convolutional Neural Networks (CNNs) continue to excel in scenarios with limited data availability. Their efficiency in terms of memory usage and latency makes them particularly suitable for deployment on edge devices. Expanding upon this, we propose Minape, a novel multimodal isotropic convolutional neural architecture that incorporates patch embedding to both time series and image data for classification purposes. By employing isotropic models, Minape addresses the challenges posed by varying data sizes and complexities of the data. It groups samples based on modality type, creating two-dimensional representations that undergo linear embedding before being processed by a scalable isotropic convolutional network architecture. The outputs of these pathways are merged and fed to a temporal classifier. Experimental results demonstrate that Minape significantly outperforms existing approaches in terms of accuracy while requiring fewer than 1M parameters and occupying less than 12 MB in size. This performance was observed on multimodal benchmark datasets and the authors' newly collected multi-dimensional multimodal dataset, Mudestreda, obtained from real industrial processing devices $$^{1}$$ ( $$^{1}$$ Link to code and dataset: https://github.com/hubtru/Minape ).

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
任性天晴完成签到,获得积分10
7秒前
乾坤侠客LW完成签到,获得积分10
8秒前
JamesPei应助szp采纳,获得10
16秒前
22秒前
27秒前
szp发布了新的文献求助10
32秒前
34秒前
Imstemcell发布了新的文献求助10
37秒前
Imstemcell完成签到,获得积分10
44秒前
赘婿应助szp采纳,获得10
48秒前
1分钟前
szp发布了新的文献求助10
1分钟前
研友_VZG7GZ应助szp采纳,获得10
1分钟前
1分钟前
NattyPoe完成签到,获得积分10
1分钟前
szp发布了新的文献求助10
1分钟前
1分钟前
顾矜应助szp采纳,获得10
1分钟前
2分钟前
szp发布了新的文献求助10
2分钟前
2分钟前
酷波er应助szp采纳,获得10
2分钟前
2分钟前
szp发布了新的文献求助10
2分钟前
orixero应助jia采纳,获得10
2分钟前
大模型应助jia采纳,获得10
2分钟前
听安发布了新的文献求助10
3分钟前
3分钟前
3分钟前
jia发布了新的文献求助10
3分钟前
复杂妙海完成签到,获得积分10
3分钟前
Shrine完成签到,获得积分10
3分钟前
田様应助szp采纳,获得10
4分钟前
4分钟前
szp发布了新的文献求助10
4分钟前
4分钟前
Lucas应助szp采纳,获得10
4分钟前
4分钟前
Isla完成签到,获得积分10
4分钟前
高分求助中
GL 2 A method for assessing the in-place cleanability of food processing equipment, Fourth Edition, December 2023 3000
Annie Ernaux: De la perte au corps glorieux 600
Writing Systems 500
类器官构建与应用:从基础到前沿 500
Electric Vehicle Powertrains Design Fundamentals, Components, and Applications 400
Handbook on Planning and Climate Change Adaptation 400
Optical Coating Design with the Essential Macleod 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6803388
求助须知:如何正确求助?哪些是违规求助? 8521232
关于积分的说明 18142556
捐赠科研通 6122751
什么是DOI,文献DOI怎么找? 3026883
邀请新用户注册赠送积分活动 2003477
关于科研通互助平台的介绍 1998048