CTA-Net: A CNN-Transformer Aggregation Network for Improving Multi-Scale Feature Extraction

计算机科学 变压器 特征提取 网(多面体) 人工智能 模式识别(心理学) 数学 工程类 电压 电气工程 几何学
作者
Chunlei Meng,Jiacheng Yang,Wei Lin,Bowen Liu,Hongda Zhang,Chun Ouyang,Zhongxue Gan
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2410.11428
摘要

Convolutional neural networks (CNNs) and vision transformers (ViTs) have become essential in computer vision for local and global feature extraction. However, aggregating these architectures in existing methods often results in inefficiencies. To address this, the CNN-Transformer Aggregation Network (CTA-Net) was developed. CTA-Net combines CNNs and ViTs, with transformers capturing long-range dependencies and CNNs extracting localized features. This integration enables efficient processing of detailed local and broader contextual information. CTA-Net introduces the Light Weight Multi-Scale Feature Fusion Multi-Head Self-Attention (LMF-MHSA) module for effective multi-scale feature integration with reduced parameters. Additionally, the Reverse Reconstruction CNN-Variants (RRCV) module enhances the embedding of CNNs within the transformer architecture. Extensive experiments on small-scale datasets with fewer than 100,000 samples show that CTA-Net achieves superior performance (TOP-1 Acc 86.76\%), fewer parameters (20.32M), and greater efficiency (FLOPs 2.83B), making it a highly efficient and lightweight solution for visual tasks on small-scale datasets (fewer than 100,000).

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
李振聪发布了新的文献求助10
刚刚
CHBW发布了新的文献求助10
刚刚
刚刚
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
1秒前
李振聪发布了新的文献求助10
1秒前
李振聪发布了新的文献求助10
1秒前
1秒前
李振聪发布了新的文献求助10
2秒前
2秒前
李振聪发布了新的文献求助10
2秒前
李振聪发布了新的文献求助100
2秒前
李振聪发布了新的文献求助10
2秒前
李振聪发布了新的文献求助10
2秒前
李振聪发布了新的文献求助10
2秒前
李振聪发布了新的文献求助10
2秒前
李振聪发布了新的文献求助10
2秒前
2秒前
李振聪发布了新的文献求助10
2秒前
2秒前
3秒前
zh关闭了zh文献求助
3秒前
李振聪发布了新的文献求助10
3秒前
李振聪发布了新的文献求助10
3秒前
李振聪发布了新的文献求助10
3秒前
李振聪发布了新的文献求助10
3秒前
李振聪发布了新的文献求助10
3秒前
3秒前
李振聪发布了新的文献求助10
3秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
Elevating Next Generation Genomic Science and Technology using Machine Learning in the Healthcare Industry Applied Machine Learning for IoT and Data Analytics 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6443673
求助须知:如何正确求助?哪些是违规求助? 8257473
关于积分的说明 17587196
捐赠科研通 5502394
什么是DOI,文献DOI怎么找? 2900959
邀请新用户注册赠送积分活动 1877987
关于科研通互助平台的介绍 1717534