Learning discriminative visual semantic embedding for zero-shot recognition

判别式 嵌入 计算机科学 人工智能 视觉空间 语义学(计算机科学) 可视化 模式识别(心理学) 机器学习 集合(抽象数据类型) 特征(语言学) 模棱两可 水准点(测量) 自然语言处理 语言学 哲学 大地测量学 神经科学 感知 生物 程序设计语言 地理
作者
Yurui Xie,Tiecheng Song,Jianying Yuan
出处
期刊:Signal Processing-image Communication [Elsevier BV]
卷期号:115: 116955-116955 被引量:3
标识
DOI:10.1016/j.image.2023.116955
摘要

We present a novel zero-shot learning (ZSL) method that concentrates on strengthening the discriminative visual information of the semantic embedding space for recognizing object classes. To address the ZSL problem, many previous works strive to learn a transformation to bridge the visual features and semantic representations, while ignoring that the discriminative property of the semantic embedding space can benefit zero-shot prediction tasks. Among these existing approaches, human-defined attributes are typically employed to build up the mid-level semantics. However, the discriminative capability and completeness of manually defined attributes are hard to guarantee, which may easily cause semantic ambiguity. To alleviate this issue, we propose a discriminative visual semantic embedding (DVSE) model that formulates the ZSL problem as a supervised dictionary learning framework. The proposed method is capable of exploring a set of discriminative visual attributes and ensures knowledge transfer across categories. Moreover, a unified objective is introduced to generate an augmented semantic embedding space where these learned visual attributes and human-defined attributes are incorporated jointly for consolidating the visual cues of feature representations. Finally, we treat the DVSE model as an optimization problem and further propose an iterative solver. Extensive experiments on several challenging benchmark datasets demonstrate that the proposed method achieves favorable performances compared with state-of-the-art ZSL approaches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cy发布了新的文献求助10
刚刚
尊敬的诗兰应助一杯半茶采纳,获得10
1秒前
2秒前
2秒前
learning发布了新的文献求助10
3秒前
黄小花发布了新的文献求助10
3秒前
HUSH994发布了新的文献求助10
4秒前
思源应助典雅的纸飞机采纳,获得10
4秒前
xu发布了新的文献求助10
4秒前
4秒前
ZENITH完成签到,获得积分10
5秒前
Lucas应助Sev采纳,获得10
5秒前
6秒前
小柚完成签到,获得积分10
6秒前
我是老大应助苗条的忆雪采纳,获得10
6秒前
6秒前
6秒前
6秒前
6秒前
斯文败类应助dudu采纳,获得10
7秒前
wfk完成签到,获得积分10
7秒前
Harry完成签到,获得积分10
7秒前
8秒前
8秒前
111222完成签到,获得积分20
8秒前
卡卡罗特完成签到,获得积分10
8秒前
8秒前
所所应助WuX采纳,获得10
9秒前
9秒前
10秒前
wzwz发布了新的文献求助10
10秒前
1111发布了新的文献求助10
11秒前
11秒前
浅浅发布了新的文献求助10
12秒前
欢呼墨镜完成签到,获得积分10
13秒前
清pq发布了新的文献求助10
13秒前
13秒前
13秒前
14秒前
酷波er应助呆萌的秋翠采纳,获得10
14秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
Research Methods for Applied Linguistics 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6405867
求助须知:如何正确求助?哪些是违规求助? 8225073
关于积分的说明 17438908
捐赠科研通 5458279
什么是DOI,文献DOI怎么找? 2884204
邀请新用户注册赠送积分活动 1860565
关于科研通互助平台的介绍 1701655