Toward Video Anomaly Retrieval From Video Anomaly Detection: New Benchmarks and Model

计算机科学 光学(聚焦) 异常检测 杠杆(统计) 异常(物理) 背景(考古学) 情报检索 任务(项目管理) 钥匙(锁) 事件(粒子物理) 人工智能 数据挖掘 生物 光学 物理 古生物学 量子力学 经济 管理 计算机安全 凝聚态物理
作者
Peng Wu,Jing Liu,Xiangteng He,Yuxin Peng,Peng Wang,Yanning Zhang
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:33: 2213-2225 被引量:13
标识
DOI:10.1109/tip.2024.3374070
摘要

Video anomaly detection (VAD) has been paid increasing attention due to its potential applications, its current dominant tasks focus on online detecting anomalies, which can be roughly interpreted as the binary or multiple event classification. However, such a setup that builds relationships between complicated anomalous events and single labels, e.g., "vandalism", is superficial, since single labels are deficient to characterize anomalous events. In reality, users tend to search a specific video rather than a series of approximate videos. Therefore, retrieving anomalous events using detailed descriptions is practical and positive but few researches focus on this. In this context, we propose a novel task called Video Anomaly Retrieval (VAR), which aims to pragmatically retrieve relevant anomalous videos by cross-modalities, e.g., language descriptions and synchronous audios. Unlike the current video retrieval where videos are assumed to be temporally well-trimmed with short duration, VAR is devised to retrieve long untrimmed videos which may be partially relevant to the given query. To achieve this, we present two large-scale VAR benchmarks and design a model called Anomaly-Led Alignment Network (ALAN) for VAR. In ALAN, we propose an anomaly-led sampling to focus on key segments in long untrimmed videos. Then, we introduce an efficient pretext task to enhance semantic associations between video-text fine-grained representations. Besides, we leverage two complementary alignments to further match cross-modal contents. Experimental results on two benchmarks reveal the challenges of VAR task and also demonstrate the advantages of our tailored method. Captions are publicly released at https://github.com/Roc-Ng/VAR.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
大雄发布了新的文献求助10
2秒前
jeffrey完成签到,获得积分0
10秒前
猪蹄完成签到,获得积分10
14秒前
chloe完成签到,获得积分10
17秒前
友好的牛排完成签到,获得积分10
17秒前
liaomr完成签到 ,获得积分10
21秒前
春眠不觉小小酥完成签到,获得积分10
24秒前
美少叔叔完成签到 ,获得积分10
28秒前
林药师完成签到,获得积分10
37秒前
38秒前
运敬完成签到 ,获得积分10
39秒前
47秒前
芥菜种子完成签到 ,获得积分10
48秒前
大雄发布了新的文献求助10
53秒前
MQ完成签到,获得积分10
55秒前
57秒前
chaoge完成签到 ,获得积分10
59秒前
方圆完成签到 ,获得积分10
1分钟前
从来都不会放弃zr完成签到,获得积分10
1分钟前
梅特卡夫完成签到,获得积分10
1分钟前
烟花应助科研通管家采纳,获得10
1分钟前
沉静的煎蛋完成签到 ,获得积分10
1分钟前
MC123完成签到,获得积分10
1分钟前
小李子完成签到 ,获得积分10
1分钟前
欣欣完成签到 ,获得积分10
1分钟前
隐形的谷槐完成签到 ,获得积分10
1分钟前
博林大师完成签到,获得积分0
1分钟前
大雄完成签到,获得积分10
1分钟前
菠萝蜜完成签到 ,获得积分10
1分钟前
1分钟前
大雄发布了新的文献求助10
1分钟前
莹莹哒发布了新的文献求助10
1分钟前
2分钟前
2分钟前
赘婿应助莹莹哒采纳,获得10
2分钟前
CAOHOU应助大雄采纳,获得10
2分钟前
2分钟前
莹莹哒完成签到,获得积分10
2分钟前
2分钟前
我不是奶黄包完成签到,获得积分10
2分钟前
高分求助中
【重要!!请各位用户详细阅读此贴】科研通的精品贴汇总(请勿应助) 10000
Three plays : drama 1000
International Code of Nomenclature for algae, fungi, and plants (Madrid Code) (Regnum Vegetabile) 1000
Semantics for Latin: An Introduction 999
Robot-supported joining of reinforcement textiles with one-sided sewing heads 530
Apiaceae Himalayenses. 2 500
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 490
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4086713
求助须知:如何正确求助?哪些是违规求助? 3625608
关于积分的说明 11497408
捐赠科研通 3339025
什么是DOI,文献DOI怎么找? 1835753
邀请新用户注册赠送积分活动 903914
科研通“疑难数据库(出版商)”最低求助积分说明 822005