Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations

计算机科学 动画 计算机人脸动画 面部表情 面子(社会学概念) 人工智能 语音识别 计算机动画 计算机视觉 计算机图形学(图像) 社会科学 社会学
作者
Rongliang Wu,Yingchen Yu,Fangneng Zhan,Jiahui Zhang,Xiaoqin Zhang,Shijian Lu
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2304.08945
摘要

Audio-driven talking face generation, which aims to synthesize talking faces with realistic facial animations (including accurate lip movements, vivid facial expression details and natural head poses) corresponding to the audio, has achieved rapid progress in recent years. However, most existing work focuses on generating lip movements only without handling the closely correlated facial expressions, which degrades the realism of the generated faces greatly. This paper presents DIRFA, a novel method that can generate talking faces with diverse yet realistic facial animations from the same driving audio. To accommodate fair variation of plausible facial animations for the same audio, we design a transformer-based probabilistic mapping network that can model the variational facial animation distribution conditioned upon the input audio and autoregressively convert the audio signals into a facial animation sequence. In addition, we introduce a temporally-biased mask into the mapping network, which allows to model the temporal dependency of facial animations and produce temporally smooth facial animation sequence. With the generated facial animation sequence and a source image, photo-realistic talking faces can be synthesized with a generic generation network. Extensive experiments show that DIRFA can generate talking faces with realistic facial animations effectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
happy完成签到,获得积分10
刚刚
Only完成签到 ,获得积分10
5秒前
magic_sweets完成签到,获得积分10
5秒前
苦哈哈完成签到,获得积分10
9秒前
独步天下完成签到,获得积分10
10秒前
阿策完成签到,获得积分10
11秒前
搜集达人应助科研学徒采纳,获得10
11秒前
SHANSHAN完成签到 ,获得积分10
14秒前
牛肉面完成签到,获得积分10
14秒前
Somnolence咩完成签到,获得积分10
15秒前
16秒前
白露完成签到 ,获得积分10
16秒前
干净的谷蕊完成签到 ,获得积分10
16秒前
慕辰完成签到 ,获得积分10
18秒前
genomed应助牛肉面采纳,获得40
19秒前
杨涵完成签到 ,获得积分10
23秒前
细心难摧完成签到 ,获得积分10
23秒前
光亮的代真完成签到 ,获得积分10
24秒前
现代完成签到,获得积分10
24秒前
lx完成签到,获得积分10
25秒前
ZHR完成签到 ,获得积分10
28秒前
俊秀的思山完成签到,获得积分10
34秒前
34秒前
daiyue完成签到 ,获得积分10
35秒前
35秒前
飒卡完成签到 ,获得积分10
35秒前
研友_842M4n完成签到,获得积分10
36秒前
啊熙完成签到 ,获得积分10
37秒前
萧然完成签到,获得积分10
39秒前
盯盯盯完成签到 ,获得积分10
39秒前
蓝梦诗音发布了新的文献求助10
39秒前
好运常在完成签到,获得积分10
40秒前
枫糖叶落完成签到,获得积分10
41秒前
柒邪完成签到 ,获得积分10
43秒前
堇言发布了新的文献求助10
43秒前
nicky完成签到 ,获得积分0
44秒前
50秒前
orixero应助蓝梦诗音采纳,获得10
50秒前
凶狠的石头完成签到 ,获得积分10
51秒前
鲁啊鲁完成签到 ,获得积分10
51秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
卤化钙钛矿人工突触的研究 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 610
2026 Hospital Accreditation Standards 500
脑电大模型与情感脑机接口研究--郑伟龙 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6272623
求助须知:如何正确求助?哪些是违规求助? 8092017
关于积分的说明 16913753
捐赠科研通 5342998
什么是DOI,文献DOI怎么找? 2841249
邀请新用户注册赠送积分活动 1818521
关于科研通互助平台的介绍 1675909