清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

PLOVAD: Prompting Vision-Language Models for Open Vocabulary Video Anomaly Detection

计算机科学 词汇 人工智能 计算机视觉 异常检测 自然语言处理 语音识别 语言学 哲学
作者
Chanchan Xu,Ke Xu,Xinghao Jiang,Tanfeng Sun
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:: 1-1 被引量:2
标识
DOI:10.1109/tcsvt.2025.3528108
摘要

Video anomaly detection (VAD) confronts significant challenges arising from data scarcity in real-world open scenarios, encompassing sparse annotations, labeling costs, and limitations on closed-set class definitions, particularly when scene diversity surpasses available training data. Although current weakly-supervised VAD methods offer partial alleviation, their inherent confinement to closed-set paradigms renders them inadequate in open-world contexts. Therefore, this paper explores open vocabulary video anomaly detection (OVVAD), leveraging abundant vision-related language data to detect and categorize both seen and unseen anomalies. To this end, we propose a robust framework, PLOVAD, designed to prompt tuning large-scale pretrained image-based vision-language models (I-VLMs) for the OVVAD task. PLOVAD consists of two main modules: the Prompting Module, featuring a learnable prompt to capture domain-specific knowledge and an anomaly-specific prompt crafted by a large language model (LLM) to capture semantic nuances and enhance generalization; and the Temporal Module, which integrates temporal information using graph attention network (GAT) stacking atop frame-wise visual features to address the transition from static images to videos. Extensive experiments on four benchmarks demonstrate the superior detection and categorization performance of our approach in the OVVAD task without bringing excessive parameters.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Yang发布了新的文献求助50
1秒前
cg666完成签到 ,获得积分10
12秒前
17秒前
可乐发布了新的文献求助10
38秒前
科研通AI6应助科研通管家采纳,获得10
1分钟前
科研通AI6应助科研通管家采纳,获得10
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
1分钟前
1分钟前
Yang完成签到,获得积分10
1分钟前
李爱国应助幸运采纳,获得10
1分钟前
happy璇完成签到 ,获得积分10
1分钟前
JamesPei应助骆云采纳,获得10
1分钟前
1分钟前
幸运发布了新的文献求助10
1分钟前
幸运完成签到,获得积分10
1分钟前
1分钟前
maolao发布了新的文献求助10
2分钟前
arniu2008完成签到,获得积分10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
2分钟前
yukky发布了新的文献求助10
2分钟前
2分钟前
Raccoon123完成签到,获得积分10
2分钟前
2分钟前
Raccoon123发布了新的文献求助10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
漂亮的天宇完成签到 ,获得积分10
2分钟前
可爱谷蕊完成签到,获得积分10
2分钟前
可爱谷蕊发布了新的文献求助40
3分钟前
3分钟前
科研通AI6应助科研通管家采纳,获得10
3分钟前
科研通AI6应助科研通管家采纳,获得10
3分钟前
科研通AI6应助科研通管家采纳,获得10
3分钟前
大模型应助maolao采纳,获得30
3分钟前
maolao完成签到,获得积分20
3分钟前
haha完成签到,获得积分10
3分钟前
Singularity应助Ww采纳,获得10
3分钟前
欣欣完成签到,获得积分10
3分钟前
3分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Forensic and Legal Medicine Third Edition 5000
Introduction to strong mixing conditions volume 1-3 5000
Agyptische Geschichte der 21.30. Dynastie 3000
Aerospace Engineering Education During the First Century of Flight 2000
从k到英国情人 1700
„Semitische Wissenschaften“? 1510
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5773095
求助须知:如何正确求助?哪些是违规求助? 5606583
关于积分的说明 15430399
捐赠科研通 4905760
什么是DOI,文献DOI怎么找? 2639726
邀请新用户注册赠送积分活动 1587652
关于科研通互助平台的介绍 1542604