A Deep Multi-Modal CNN for Multi-Instance Multi-Label Image Classification

人工智能 卷积神经网络 计算机科学 图像(数学) 上下文图像分类 模式识别(心理学) 背景(考古学) 水准点(测量) 情态动词 多标签分类 机器学习 古生物学 生物 化学 高分子化学 地理 大地测量学
作者
Lingyun Song,Jun Liu,Buyue Qian,Mingxuan Sun,Kuan Yang,Meng Sun,Samar Abbas
出处
期刊:IEEE Transactions on Image Processing 卷期号:27 (12): 6025-6038 被引量:73
标识
DOI:10.1109/tip.2018.2864920
摘要

Deep convolutional neural networks (CNNs) have shown superior performance on the task of single-label image classification. However, the applicability of CNNs to multi-label images still remains an open problem, mainly because of two reasons. First, each image is usually treated as an inseparable entity and represented as one instance, which mixes the visual information corresponding to different labels. Second, the correlations amongst labels are often overlooked. To address these limitations, we propose a deep multi-modal CNN for multi-instance multi-label image classification, called MMCNN-MIML. By combining CNNs with multi-instance multi-label (MIML) learning, our model represents each image as a bag of instances for image classification and inherits the merits of both CNNs and MIML. In particular, MMCNN-MIML has three main appealing properties: 1) it can automatically generate instance representations for MIML by exploiting the architecture of CNNs; 2) it takes advantage of the label correlations by grouping labels in its later layers; and 3) it incorporates the textual context of label groups to generate multi-modal instances, which are effective in discriminating visually similar objects belonging to different groups. Empirical studies on several benchmark multi-label image data sets show that MMCNN-MIML significantly outperforms the state-of-the-art baselines on multi-label image classification tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
暖呼呼的大太阳完成签到,获得积分10
5秒前
清尘hm发布了新的文献求助10
8秒前
9秒前
科目三应助lancekkk采纳,获得10
10秒前
11秒前
zyh完成签到,获得积分20
14秒前
gaohui完成签到,获得积分10
16秒前
16秒前
Singularity应助鲤鱼酸奶采纳,获得20
17秒前
yurinsy完成签到,获得积分10
18秒前
重要从灵发布了新的文献求助10
19秒前
20秒前
雨泽应助Joe采纳,获得10
20秒前
丘比特应助lgs采纳,获得10
21秒前
22秒前
务实的芒果完成签到,获得积分10
22秒前
24秒前
24秒前
ccm应助linzy采纳,获得10
25秒前
li发布了新的文献求助10
25秒前
muwang发布了新的文献求助10
26秒前
脑洞疼应助Fury采纳,获得10
28秒前
cw123发布了新的文献求助10
29秒前
嘟嘟嘟完成签到 ,获得积分10
31秒前
31秒前
Maestro_S应助camelli采纳,获得10
31秒前
31秒前
甜蜜的道天完成签到,获得积分10
34秒前
34秒前
勤恳的雍发布了新的文献求助10
35秒前
36秒前
缓慢谷云完成签到,获得积分10
36秒前
36秒前
li完成签到,获得积分10
38秒前
W哇发布了新的文献求助10
38秒前
雨泽应助上进boy采纳,获得10
38秒前
雨泽应助muwang采纳,获得10
38秒前
听话的毒娘完成签到,获得积分10
39秒前
39秒前
39秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
The role of families in providing long term care to the frail and chronically ill elderly living in the community 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2555811
求助须知:如何正确求助?哪些是违规求助? 2179821
关于积分的说明 5621538
捐赠科研通 1901188
什么是DOI,文献DOI怎么找? 949646
版权声明 565592
科研通“疑难数据库(出版商)”最低求助积分说明 504754