清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Emulating human-like adaptive vision for efficient and flexible machine visual perception

可解释性 计算机科学 人工智能 推论 固定(群体遗传学) 感知 机器学习 过程(计算) 强化学习 视觉感受 主动视觉 计算机视觉 资源(消歧) 机器视觉 任务(项目管理) 可视化 适应(眼睛) 深度学习 视觉处理 代表(政治) 人机交互 眼动 帧速率 具身认知 有限的资源 深层神经网络 伪装 还原(数学) 机器人学
作者
Yulin Wang,Yue Yang,Yang Yue,Huanqian Wang,Haojun Jiang,Yizeng Han,Zanlin Ni,Yifan Pu,Minglei Shi,Rui Lu,Qisen Yang,Angxiao Zhao,Zhuofan Xia,Shiji Song,Gao Huang
出处
期刊:Nature Machine Intelligence [Nature Portfolio]
卷期号:7 (11): 1804-1822 被引量:1
标识
DOI:10.1038/s42256-025-01130-7
摘要

Human vision is highly adaptive, efficiently sampling intricate environments by sequentially fixating on task-relevant regions. In contrast, prevailing machine vision models passively process entire scenes at once, resulting in excessive resource demands scaling with spatial–temporal input resolution and model size, yielding critical limitations impeding both future advancements and real-world application. Here we introduce AdaptiveNN, a general framework aiming to enable the transition from ‘passive’ to ‘active and adaptive’ vision models. AdaptiveNN formulates visual perception as a coarse-to-fine sequential decision-making process, progressively identifying and attending to regions pertinent to the task, incrementally combining information across fixations and actively concluding observation when sufficient. We establish a theory integrating representation learning with self-rewarding reinforcement learning, enabling end-to-end training of the non-differentiable AdaptiveNN without additional supervision on fixation locations. We assess AdaptiveNN on 17 benchmarks spanning 9 tasks, including large-scale visual recognition, fine-grained discrimination, visual search, processing images from real driving and medical scenarios, language-driven embodied artificial intelligence and side-by-side comparisons with humans. AdaptiveNN achieves up to 28 times inference cost reduction without sacrificing accuracy, flexibly adapts to varying task demands and resource budgets without retraining, and provides enhanced interpretability via its fixation patterns, demonstrating a promising avenue towards efficient, flexible and interpretable computer vision. Furthermore, AdaptiveNN exhibits closely human-like perceptual behaviours in many cases, revealing its potential as a valuable tool for investigating visual cognition. A deep learning approach, AdaptiveNN, shifts machine vision models from passive to active to mimic human-like perception. The method achieves inference costs that are up to 28-times lower without accuracy loss, while showcasing online-adaptable and interpretable behaviours.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小米完成签到,获得积分10
8秒前
寒冷的月亮完成签到 ,获得积分10
9秒前
久伴久爱完成签到 ,获得积分10
13秒前
彩色的依秋完成签到 ,获得积分10
27秒前
宇文雨文完成签到 ,获得积分10
1分钟前
sonicker完成签到 ,获得积分10
1分钟前
YZY完成签到 ,获得积分10
1分钟前
lingling完成签到 ,获得积分10
2分钟前
Copyright应助科研通管家采纳,获得10
2分钟前
singlehzp完成签到 ,获得积分10
2分钟前
cpx完成签到 ,获得积分10
3分钟前
3分钟前
麦冬粑粑完成签到,获得积分10
3分钟前
卡卡完成签到,获得积分10
3分钟前
Savitr发布了新的文献求助10
3分钟前
kkdg完成签到,获得积分10
3分钟前
千帆完成签到,获得积分10
3分钟前
Savitr完成签到,获得积分10
3分钟前
KKDG完成签到,获得积分10
3分钟前
kaka完成签到,获得积分10
3分钟前
huohuo143完成签到,获得积分10
3分钟前
唐唐完成签到,获得积分10
4分钟前
偷得浮生半日闲完成签到 ,获得积分10
4分钟前
阳光丸子完成签到 ,获得积分10
4分钟前
凌泉完成签到 ,获得积分10
4分钟前
Magic完成签到 ,获得积分10
5分钟前
郭强完成签到,获得积分10
5分钟前
爱的魔力转圈圈完成签到,获得积分10
5分钟前
科研通AI6.3应助积极忆翠采纳,获得10
5分钟前
LuciusHe完成签到,获得积分10
5分钟前
Arctic完成签到 ,获得积分10
5分钟前
陌桑子完成签到 ,获得积分10
6分钟前
科研通AI2S应助科研通管家采纳,获得10
6分钟前
充电宝应助科研通管家采纳,获得10
6分钟前
6分钟前
Hello应助科研通管家采纳,获得10
6分钟前
我是笨蛋完成签到 ,获得积分10
7分钟前
无悔完成签到 ,获得积分0
7分钟前
做实验的猫完成签到,获得积分0
7分钟前
贝贝完成签到 ,获得积分0
8分钟前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
Cronologia da história de Macau 5000
Merrill's Atlas of Radiographic Positioning and Procedures - 3-Volume Set, 16th Edition 2000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7144647
求助须知:如何正确求助?哪些是违规求助? 8791876
关于积分的说明 18580843
捐赠科研通 6737316
什么是DOI,文献DOI怎么找? 3157243
关于科研通互助平台的介绍 2286965
邀请新用户注册赠送积分活动 2131616