亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Learning realistic lip motions for humanoid face robots

仿人机器人 人工智能 计算机科学 机器人 同步(交流) 计算机视觉 面子(社会学概念) 运动(物理) 自编码 手势 弹道 人机交互 人机交互 启发式 语音识别 适应性 机器人学 隐马尔可夫模型 衔接(社会学) 简单(哲学) 动作(物理) 自由度(物理和化学) 机器人控制 管道(软件) 社交机器人
作者
Y. Charlie Hu,Jiong Lin,Judah Goldfeder,Philippe Martin Wyder,Yifeng Cao,Steven Tian,Yunzhe Wang,Jingran Wang,M. Wang,Jie Zeng,Cameron Mehlman,Yingke Wang,Delin Zeng,Boyuan Chen,Hod Lipson
标识
DOI:10.5061/dryad.j6q573nrc
摘要

Lip motion represents outsized importance in human communication, capturing nearly half of our visual attention during conversation. Yet anthropomorphic robots often fail to achieve lip-audio synchronization, resulting in clumsy and lifeless lip behaviors. Two fundamental barriers underlay this challenge. First, robotic lips typically lack the mechanical complexity required to reproduce nuanced human mouth movements; second, existing synchronization methods depend on manually predefined movements and rules, restricting adaptability and realism. Here, we present a humanoid robot face designed to overcome these limitations, featuring soft silicone lips actuated by a ten-degree-of-freedom (10-DoF) mechanism. To achieve lip synchronization without predefined movements, we use a self-supervised learning pipeline based on a Variational Autoencoder (VAE) combined with a Facial Action Transformer, enabling the robot to autonomously infer more realistic lip trajectories directly from speech audio. Our experimental results suggest that this method outperforms simple heuristics like amplitude-based baselines in achieving more visually coherent lip-audio synchronization. Furthermore, the learned synchronization successfully generalizes across multiple linguistic contexts, enabling robot speech articulation in ten languages unseen during training.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
楊子发布了新的文献求助10
刚刚
柳穿鱼发布了新的文献求助10
刚刚
1秒前
1秒前
4秒前
zhangqian完成签到 ,获得积分10
5秒前
Sivan发布了新的文献求助10
6秒前
123123发布了新的文献求助10
7秒前
haifeng完成签到,获得积分10
9秒前
Aurora完成签到,获得积分20
10秒前
11秒前
楊子完成签到,获得积分10
12秒前
谷粒粒发布了新的文献求助30
14秒前
SciGPT应助Www采纳,获得10
15秒前
OYY完成签到,获得积分20
20秒前
22秒前
隐形曼青应助奋斗觅海采纳,获得10
22秒前
CodeCraft应助马思婕采纳,获得10
23秒前
wkk发布了新的文献求助10
27秒前
晚来风与雪完成签到 ,获得积分10
31秒前
爱吃大米饭完成签到 ,获得积分10
31秒前
37秒前
38秒前
你没事吧完成签到 ,获得积分10
39秒前
40秒前
罗乐天发布了新的文献求助10
42秒前
小先发布了新的文献求助10
42秒前
43秒前
马思婕发布了新的文献求助10
45秒前
丘比特应助drake采纳,获得10
48秒前
wkk完成签到,获得积分10
49秒前
小周发布了新的文献求助10
51秒前
Sulin完成签到,获得积分10
54秒前
MONSTER完成签到,获得积分10
55秒前
霸气的忆丹完成签到 ,获得积分10
1分钟前
zhangqq完成签到,获得积分10
1分钟前
卖药丸的兔子完成签到 ,获得积分10
1分钟前
小枣完成签到 ,获得积分10
1分钟前
顾矜应助科研通管家采纳,获得10
1分钟前
科目三应助科研通管家采纳,获得10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 2000
Digital Twins of Advanced Materials Processing 2000
晋绥日报合订本24册(影印本1986年)【1940年9月–1949年5月】 1000
Social Cognition: Understanding People and Events 1000
Polymorphism and polytypism in crystals 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6033822
求助须知:如何正确求助?哪些是违规求助? 7731156
关于积分的说明 16204780
捐赠科研通 5180456
什么是DOI,文献DOI怎么找? 2772333
邀请新用户注册赠送积分活动 1755569
关于科研通互助平台的介绍 1640360