分散注意力
计算机科学
分割
对象(语法)
计算机视觉
人工智能
心理学
认知心理学
作者
Haiyang Mei,Xin Yang,Yunduo Zhou,Gepeng Ji,Xiaopeng Wei,Deng-Ping Fan
出处
期刊:Zhongguo kexue
[Science China Press]
日期:2023-05-08
卷期号:54 (3): 653-653
被引量:18
标识
DOI:10.1360/ssi-2022-0138
摘要
本文致力于设计一个有效且高效的伪装物体分割(Camouflaged Object Segmentation, COS)模型. 为此,本文开发了一个生物启发的框架,称为金字塔定位和聚焦网络(Pyramid Positioning and Focus Network, PFNet+),其模仿了自然界中的捕食过程. 具体地,本文的PFNet+包含三个关键模块,即:上下文增强模块(Context Enrichment, CEn)、金字塔定位模块(Pyramid Positioning Module, PPM)和聚焦模块(Focus Module, FM). CEn通过整合上下文信息来增强骨干特征的表征能力,从而提供更有辨别性的骨干特征. PPM被设计用来模仿捕食中的检测过程,以金字塔的方式从全局的角度定位潜在的目标物体. 然后FM被用来执行捕食中的识别过程,通过在歧义区域的聚焦来逐步细化初始的预测结果. 值得注意的是,在FM中,本文开发了一个新颖的分心挖掘策略以用于分心区域的发现和去除,以提高预测的性能. 大量的实验证明本文的PFNet+能够实时运行(56fps),在四个标准度量指标下,PFNet+在三个具有挑战性的数据集上都显著优于现有的20个最新模型,在其他视觉任务(如息肉分割)上的实验进一步证明了PFNet+的泛化能力. 项目主页:https://mhaiyang.github.io/SSI2023-PFNet-Plus.
科研通智能强力驱动
Strongly Powered by AbleSci AI