发布文献求助

Unifying Heterogeneous Multi-Modal Remote Sensing Detection Via Language-Pivoted Pretraining

计算机科学粒度模态（人机交互）集合（抽象数据类型）目标检测人工智能钥匙（锁）任务（项目管理）遥感桥（图论）训练集对象（语法）桥接（联网）计算机视觉自然语言处理任务分析语义学（计算机科学）视觉对象识别的认知神经科学联轴节（管道）自然语言模拟退火结构化预测语义映射模式（计算机接口）

作者

Yuxuan Li,Yuming Chen,Yunheng Li,Ming-Ming Cheng,Xiang Li,Jian Yang

出处

期刊：Cornell University - arXiv 日期：2026-03-02

标识

DOI：10.48550/arxiv.2603.01758

摘要

Heterogeneous multi-modal remote sensing object detection aims to accurately detect objects from diverse sensors (e.g., RGB, SAR, Infrared). Existing approaches largely adopt a late alignment paradigm, in which modality alignment and task-specific optimization are entangled during downstream fine-tuning. This tight coupling complicates optimization and often results in unstable training and suboptimal generalization. To address these limitations, we propose BabelRS, a unified language-pivoted pretraining framework that explicitly decouples modality alignment from downstream task learning. BabelRS comprises two key components: Concept-Shared Instruction Aligning (CSIA) and Layerwise Visual-Semantic Annealing (LVSA). CSIA aligns each sensor modality to a shared set of linguistic concepts, using language as a semantic pivot to bridge heterogeneous visual representations. To further mitigate the granularity mismatch between high-level language representations and dense detection objectives, LVSA progressively aggregates multi-scale visual features to provide fine-grained semantic guidance. Extensive experiments demonstrate that BabelRS stabilizes training and consistently outperforms state-of-the-art methods without bells and whistles. Code: https://github.com/zcablii/SM3Det.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

📰 新增『新锐期刊分区』 (2026-3-24)

更新

💬 新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒 每天60秒读懂世界·精选全球要闻 (2026-1-2)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 大个上传了应助文件

2秒前; Syening上传了应助文件

3秒前; 烟花的应助被喜羊羊采纳，获得10

4秒前; 天天快乐的应助被斯派克采纳，获得10

4秒前; 无语的从云完成签到，获得积分10

4秒前; 理智的疯子发布了新的文献求助10

4秒前; Mengjiao完成签到，获得积分20

4秒前; 李健的粉丝团团长的应助被精明的烨霖采纳，获得10

5秒前; 科研通AI6.2的应助被Jeux采纳，获得10

5秒前; 酷波er的应助被干净的向松采纳，获得10

5秒前; 走上再走下发布了新的文献求助10

6秒前; yc的应助被辛勤采柳采纳，获得10

7秒前; Leisle上传了应助文件

7秒前; OrangeLight完成签到，获得积分10

9秒前; FYA完成签到，获得积分10

9秒前; sherry发布了新的文献求助10

9秒前; 小二郎的应助被舒适忆枫采纳，获得10

9秒前; 完美世界的应助被Rando采纳，获得10

9秒前; 一一一完成签到，获得积分10

10秒前; 酷波er的应助被难过的班采纳，获得10

12秒前; 李健上传了应助文件

12秒前; 辛勤采柳完成签到，获得积分10

15秒前; 英俊的铭上传了应助文件

15秒前; instinct发布了新的文献求助10

15秒前; 甜美无剑上传了应助文件

16秒前; 大模型的应助被胖秋采纳，获得10

16秒前; 科研通AI6.1上传了应助文件

17秒前; 万能图书馆上传了应助文件

18秒前; 慕青的应助被xiaolizi采纳，获得10

18秒前; Akim上传了应助文件

18秒前; Br关闭了Br的文献求助

18秒前; 上官若男上传了应助文件

18秒前; 匿颢完成签到，获得积分10

19秒前; 悦耳的鸿煊完成签到，获得积分10

20秒前; 无限绿旋发布了新的文献求助10

20秒前; 李健的粉丝团团长上传了应助文件

21秒前; 科研通管家关闭了笑ige的文献求助

22秒前; 科研通管家关闭了仇晓煜的文献求助

22秒前; CFD的应助被舒适忆枫采纳，获得10

23秒前; Ava的应助被科研通管家采纳，获得10

23秒前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Developing Genetic Editing Tools for Lysobacter 2000; Моделирование процессов самоорганизации в кристаллообразующих системах 1000; Adhesion Science: Principles & Practice 800; Signals, Systems, and Signal Processing 610; IEST-RP-CC018: Cleanroom Cleaning and Sanitization: Operating and Monitoring Procedures 600; Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 6527340; 求助须知：如何正确求助？哪些是违规求助？ 8320450; 关于积分的说明 17810535; 捐赠科研通 5629128; 什么是DOI，文献DOI怎么找？ 2930169; 邀请新用户注册赠送积分活动 1906879; 关于科研通互助平台的介绍 1766450

今日热心研友

学术文献互助

小牛马阿欢

殷勤的紫槐

贪玩的秋柔

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通