Panoptic Perception: A Novel Task and Fine-Grained Dataset for Universal Remote Sensing Image Interpretation

计算机科学 遥感 全视子 口译(哲学) 感知 任务(项目管理) 计算机视觉 人工智能 图像(数学) 人机交互 地质学 政治 生物 经济 神经科学 管理 程序设计语言 法学 政治学
作者
Danpei Zhao,Bo Yuan,Ziqiang Chen,Tian Li,Zhuoran Liu,Wentao Li,Yue Gao
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:62: 1-14 被引量:3
标识
DOI:10.1109/tgrs.2024.3392778
摘要

Current remote-sensing interpretation models often focus on a single task such as detection, segmentation, or caption. However, the task-specific designed models are unattainable to achieve the comprehensive multi-level interpretation of images. The field also lacks support for multi-task joint interpretation datasets. In this paper, we propose Panoptic Perception: a novel task and a new fine-grained dataset (FineGrip) to achieve a more thorough and universal interpretation for RSIs. The new task: 1) integrates pixel-level, instance-level, and image-level information for universal image perception, 2) captures image information from coarse to fine granularity, achieving deeper scene understanding and description, and 3) enables various independent tasks to complement and enhance each other through multi-task learning. By emphasizing multi-task interactions and the consistency of perception results, this task enables the simultaneous processing of fine-grained foreground instance segmentation, background semantic segmentation, and global fine-grained image captioning. Concretely, the FineGrip dataset includes 2,649 remote sensing images, 12054 fine-grained instance segmentation masks belonging to 20 foreground things categories, and 7599 background semantic masks for 5 stuff classes. Furthermore, we propose a joint optimization-based panoptic perception model. Experimental results on FineGrip demonstrate the feasibility of the panoptic perception task and the beneficial effect of multi-task joint optimization on individual tasks. The dataset will be publicly available.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
2秒前
2秒前
3秒前
李爱国应助gyusbjshaxb采纳,获得10
3秒前
4秒前
慈祥的大船完成签到,获得积分10
4秒前
量子星尘发布了新的文献求助10
5秒前
gyf发布了新的文献求助10
6秒前
左右发布了新的文献求助10
6秒前
Jasper应助whereisit采纳,获得10
6秒前
6秒前
6秒前
yyf1998发布了新的文献求助10
7秒前
黄橙橙完成签到,获得积分10
7秒前
HH完成签到,获得积分10
7秒前
7秒前
7秒前
NexusExplorer应助沧元采纳,获得10
7秒前
贪玩心情发布了新的文献求助10
8秒前
9秒前
9秒前
swan发布了新的文献求助10
10秒前
科研通AI2S应助不吃橘子采纳,获得10
11秒前
科研小蔡发布了新的文献求助10
11秒前
yunyueqixun完成签到,获得积分10
12秒前
12秒前
麻辣香锅发布了新的文献求助10
12秒前
庄博一完成签到,获得积分10
12秒前
13秒前
qiuxin发布了新的文献求助30
13秒前
13秒前
姚美丽发布了新的文献求助10
13秒前
NexusExplorer应助yyf1998采纳,获得30
13秒前
咩啊咩吖给糯叽叽的年糕的求助进行了留言
14秒前
小菜鸡发布了新的文献求助10
15秒前
Guofa.发布了新的文献求助10
16秒前
16秒前
叶lo发布了新的文献求助10
16秒前
无奈孤云关注了科研通微信公众号
16秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1581
Encyclopedia of Agriculture and Food Systems Third Edition 1500
Specialist Periodical Reports - Organometallic Chemistry Organometallic Chemistry: Volume 46 1000
Handbook of Spirituality, Health, and Well-Being 800
Current Trends in Drug Discovery, Development and Delivery (CTD4-2022) 800
Foregrounding Marking Shift in Sundanese Written Narrative Segments 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5526879
求助须知:如何正确求助?哪些是违规求助? 4616832
关于积分的说明 14556118
捐赠科研通 4555346
什么是DOI,文献DOI怎么找? 2496326
邀请新用户注册赠送积分活动 1476628
关于科研通互助平台的介绍 1448142