Visuals to Text: A Comprehensive Review on Automatic Image Captioning

隐藏字幕 计算机科学 人工智能 图像(数学) 自然语言处理 深度学习 自然语言 情报检索
作者
Yue Ming,Nannan Hu,Chunxiao Fan,Fan Feng,Jiangwan Zhou,Hui Yu
出处
期刊:IEEE/CAA Journal of Automatica Sinica [Institute of Electrical and Electronics Engineers]
卷期号:9 (8): 1339-1365 被引量:4
标识
DOI:10.1109/jas.2022.105734
摘要

Image captioning refers to automatic generation of descriptive texts according to the visual content of images. It is a technique integrating multiple disciplines including the computer vision (CV), natural language processing (NLP) and artificial intelligence. In recent years, substantial research efforts have been devoted to generate image caption with impressive progress. To summarize the recent advances in image captioning, we present a comprehensive review on image captioning, covering both traditional methods and recent deep learning-based techniques. Specifically, we first briefly review the early traditional works based on the retrieval and template. Then deep learning-based image captioning researches are focused, which is categorized into the encoder-decoder framework, attention mechanism and training strategies on the basis of model structures and training manners for a detailed introduction. After that, we summarize the publicly available datasets, evaluation metrics and those proposed for specific requirements, and then compare the state of the art methods on the MS COCO dataset. Finally, we provide some discussions on open challenges and future research directions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
大个应助Summer采纳,获得20
4秒前
前----完成签到,获得积分10
4秒前
就这样关注了科研通微信公众号
7秒前
酷酷紫完成签到,获得积分10
8秒前
11秒前
黄腾发布了新的文献求助10
17秒前
17秒前
17秒前
Fall1nSun发布了新的文献求助10
17秒前
20秒前
酷123456发布了新的文献求助200
22秒前
饭饭发布了新的文献求助30
22秒前
123关闭了123文献求助
24秒前
25秒前
斯文败类应助欣慰的绮露采纳,获得10
25秒前
NexusExplorer应助高高烙采纳,获得10
27秒前
Juno发布了新的文献求助10
29秒前
hdq完成签到,获得积分10
30秒前
缓慢山柳完成签到,获得积分10
33秒前
Fall1nSun完成签到,获得积分10
36秒前
fuerfuer完成签到,获得积分10
36秒前
大清发布了新的文献求助10
37秒前
SciGPT应助李文杰采纳,获得10
37秒前
binz完成签到,获得积分10
39秒前
丘比特应助今夜无人入眠采纳,获得10
41秒前
芋泥波波完成签到,获得积分10
42秒前
科研通AI2S应助珏珏子采纳,获得10
45秒前
kytyzx完成签到 ,获得积分10
47秒前
饭饭完成签到,获得积分10
48秒前
小二郎应助苏信怜采纳,获得20
48秒前
49秒前
酷123456完成签到,获得积分10
52秒前
阿木木关注了科研通微信公众号
53秒前
温暖天与发布了新的文献求助10
53秒前
权夏瑶完成签到,获得积分10
55秒前
嗑盐发布了新的文献求助200
56秒前
i哎亚完成签到,获得积分10
56秒前
57秒前
57秒前
高分求助中
Thermodynamic data for steelmaking 3000
Teaching Social and Emotional Learning in Physical Education 900
Cardiology: Board and Certification Review 400
[Lambert-Eaton syndrome without calcium channel autoantibodies] 340
Transformerboard III 300
Towards Net Zero Carbon Initiatives A Life Cycle Assessment Perspective 200
Erbium(III) Triflate: A Valuable Catalyst for the Rearrangement of Epoxides to Aldehydes and Ketones 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2360617
求助须知:如何正确求助?哪些是违规求助? 2068157
关于积分的说明 5165848
捐赠科研通 1796375
什么是DOI,文献DOI怎么找? 897324
版权声明 557665
科研通“疑难数据库(出版商)”最低求助积分说明 478996