Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations

计算机科学 动画 计算机人脸动画 面部表情 面子(社会学概念) 人工智能 语音识别 计算机动画 计算机视觉 计算机图形学(图像) 社会科学 社会学
作者
Rongliang Wu,Yingchen Yu,Fangneng Zhan,Jiahui Zhang,Xiaoqin Zhang,Shijian Lu
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2304.08945
摘要

Audio-driven talking face generation, which aims to synthesize talking faces with realistic facial animations (including accurate lip movements, vivid facial expression details and natural head poses) corresponding to the audio, has achieved rapid progress in recent years. However, most existing work focuses on generating lip movements only without handling the closely correlated facial expressions, which degrades the realism of the generated faces greatly. This paper presents DIRFA, a novel method that can generate talking faces with diverse yet realistic facial animations from the same driving audio. To accommodate fair variation of plausible facial animations for the same audio, we design a transformer-based probabilistic mapping network that can model the variational facial animation distribution conditioned upon the input audio and autoregressively convert the audio signals into a facial animation sequence. In addition, we introduce a temporally-biased mask into the mapping network, which allows to model the temporal dependency of facial animations and produce temporally smooth facial animation sequence. With the generated facial animation sequence and a source image, photo-realistic talking faces can be synthesized with a generic generation network. Extensive experiments show that DIRFA can generate talking faces with realistic facial animations effectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
鲁卓林完成签到,获得积分10
10秒前
舒服的月饼完成签到 ,获得积分10
11秒前
MarvelerYB3完成签到,获得积分10
23秒前
紫枫完成签到,获得积分10
24秒前
宇文鹏煊完成签到 ,获得积分10
26秒前
健壮可冥完成签到 ,获得积分10
26秒前
贝贝完成签到 ,获得积分10
29秒前
虚心岂愈完成签到 ,获得积分10
30秒前
31秒前
忒寒碜完成签到,获得积分10
33秒前
隐形曼青应助11采纳,获得10
34秒前
hoongyan完成签到 ,获得积分10
35秒前
灼灼朗朗完成签到,获得积分10
36秒前
40秒前
大力的灵雁应助光亮宛白采纳,获得10
41秒前
41秒前
11发布了新的文献求助10
45秒前
46秒前
jes发布了新的文献求助10
46秒前
从容的水壶完成签到 ,获得积分10
54秒前
东郭思烟发布了新的文献求助10
55秒前
1分钟前
南宫士晋完成签到 ,获得积分10
1分钟前
JSEILWQ完成签到 ,获得积分10
1分钟前
Jasper应助於茗采纳,获得10
1分钟前
不安遥完成签到 ,获得积分10
1分钟前
东郭思烟完成签到,获得积分10
1分钟前
大大完成签到 ,获得积分10
1分钟前
1分钟前
爆米花应助科研通管家采纳,获得10
1分钟前
小蘑菇应助生物摸鱼大师采纳,获得10
1分钟前
激动的元瑶完成签到 ,获得积分10
1分钟前
於茗发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
ty完成签到 ,获得积分10
1分钟前
贝贝完成签到,获得积分0
1分钟前
吴静完成签到 ,获得积分10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
卤化钙钛矿人工突触的研究 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 610
2026 Hospital Accreditation Standards 500
脑电大模型与情感脑机接口研究--郑伟龙 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6272469
求助须知:如何正确求助?哪些是违规求助? 8091896
关于积分的说明 16913612
捐赠科研通 5342933
什么是DOI,文献DOI怎么找? 2841249
邀请新用户注册赠送积分活动 1818521
关于科研通互助平台的介绍 1675893