亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

QAVidCap: Enhancing Video Captioning through Question Answering Techniques

隐藏字幕 计算机科学 杠杆(统计) 答疑 人工智能 任务(项目管理) 自然语言处理 语言模型 自然语言 情报检索 机器学习 图像(数学) 经济 管理
作者
Hui Li Liu,Xiaojun Wan
标识
DOI:10.1145/3652583.3658061
摘要

Video captioning is the task of describing video content using natural sentences. While recent models have shown significant improvements in metrics, there are still some unresolved issues. Model-generated captions often contain factual errors and omit important details. In contrast, human-written captions excel in accurately and comprehensively describing the video content. In this work, we propose a novel method that utilizes question answering (QA) techniques to enhance video captioning models. We start by generating QA pairs from both videos and human-written captions. We propose a QA-enhanced captioning model to better leverage QA information. Finally, we employ reinforcement learning to train the model to maximize a QA reward. By incorporating QA-related techniques, our model can generate more accurate and comprehensive video captions. We conduct experiments on three datasets, namely ActivityNet Captions, YouCookII and MSR-VTT. The experimental results, ablation studies and human evaluations demonstrate the advantages of our method.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
5秒前
5秒前
redeem发布了新的文献求助10
12秒前
陆枝完成签到,获得积分10
12秒前
13秒前
负责代珊完成签到,获得积分10
13秒前
负责代珊发布了新的文献求助10
18秒前
yexu完成签到,获得积分10
24秒前
LINX完成签到 ,获得积分10
24秒前
科研通AI6.4应助redeem采纳,获得10
27秒前
LJC完成签到,获得积分10
32秒前
37秒前
聂_完成签到,获得积分10
37秒前
41秒前
ryanchung完成签到 ,获得积分10
42秒前
redeem完成签到,获得积分10
43秒前
清一完成签到,获得积分10
44秒前
丫丫发布了新的文献求助10
45秒前
烟花应助ltt采纳,获得10
46秒前
46秒前
慧木完成签到 ,获得积分10
51秒前
李健应助差异显著采纳,获得10
56秒前
scenerioxin应助乙酰乙酰CoA采纳,获得10
58秒前
爱听歌的悒完成签到 ,获得积分10
58秒前
1分钟前
CC完成签到,获得积分10
1分钟前
1分钟前
小井盖完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
差异显著发布了新的文献求助10
1分钟前
Freeasy完成签到 ,获得积分10
1分钟前
路明非发布了新的文献求助10
1分钟前
1分钟前
风吹麦田应助路明非采纳,获得10
1分钟前
1分钟前
1分钟前
1分钟前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
Standards for Molecular Testing for Red Cell, Platelet, and Neutrophil Antigens, 7th edition 1000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
Signals, Systems, and Signal Processing 610
脑电大模型与情感脑机接口研究--郑伟龙 500
GMP in Practice: Regulatory Expectations for the Pharmaceutical Industry 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6291429
求助须知:如何正确求助?哪些是违规求助? 8109505
关于积分的说明 16966960
捐赠科研通 5355243
什么是DOI,文献DOI怎么找? 2845631
邀请新用户注册赠送积分活动 1823005
关于科研通互助平台的介绍 1678538