清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Personalized Face Inpainting with Diffusion Models by Parallel Visual Attention

修补 面子(社会学概念) 计算机科学 人工智能 扩散 计算机视觉 计算机图形学(图像) 图像(数学) 社会科学 热力学 物理 社会学
作者
Jianjin Xu,Saman Motamed,Praneetha Vaddamanu,Chen Wu,Christian Haene,Jean‐Charles Bazin,Fernando De la Torre
标识
DOI:10.1109/wacv57701.2024.00535
摘要

Face inpainting is important in various applications, such as photo restoration, image editing, and virtual reality. Despite the significant advances in face generative models, ensuring that a person's unique facial identity is maintained during the inpainting process is still an elusive goal. Current state-of-the-art techniques, exemplified by MyStyle, necessitate resource-intensive fine-tuning and a substantial number of images for each new identity. Furthermore, existing methods often fall short in accommodating user-specified semantic attributes, such as beard or expression.To improve inpainting results, and reduce the computational complexity during inference, this paper proposes the use of Parallel Visual Attention (PVA) in conjunction with diffusion models. Specifically, we insert parallel attention matrices to each cross-attention module in the denoising network, which attends to features extracted from reference images by an identity encoder. We train the added attention modules and identity encoder on CelebAHQ-IDI, a dataset proposed for identity-preserving face inpainting. Experiments demonstrate that PVA attains unparalleled identity resemblance in both face inpainting and face inpainting with language guidance tasks, in comparison to various benchmarks, including MyStyle, Paint by Example, and Custom Diffusion. Our findings reveal that PVA ensures good identity preservation while offering effective language-controllability. Additionally, in contrast to Custom Diffusion, PVA requires just 40 fine-tuning steps for each new identity, which translates to a significant speed increase of over 20 times.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无花果应助科研通管家采纳,获得10
4秒前
aspirin完成签到 ,获得积分10
33秒前
酷酷的涵蕾完成签到 ,获得积分10
42秒前
研友_LN25rL完成签到,获得积分10
1分钟前
widesky777完成签到 ,获得积分0
1分钟前
1分钟前
荆棘鸟发布了新的文献求助10
1分钟前
sonicker完成签到 ,获得积分10
1分钟前
YingxueRen完成签到,获得积分10
2分钟前
荆棘鸟完成签到,获得积分10
2分钟前
赘婿应助jasonwee采纳,获得10
2分钟前
whatever应助woxinyouyou采纳,获得10
2分钟前
2分钟前
2分钟前
woxinyouyou完成签到,获得积分10
2分钟前
2分钟前
我很厉害的1q完成签到,获得积分10
2分钟前
游泳池完成签到,获得积分10
3分钟前
qianzhihe2完成签到,获得积分10
3分钟前
3分钟前
jasonwee发布了新的文献求助10
3分钟前
ccc完成签到 ,获得积分10
3分钟前
3分钟前
3分钟前
大熊完成签到 ,获得积分10
3分钟前
wood完成签到,获得积分10
3分钟前
wangwang发布了新的文献求助10
3分钟前
亚亚完成签到 ,获得积分10
3分钟前
wangwang完成签到,获得积分10
3分钟前
无辜的行云完成签到 ,获得积分0
3分钟前
herpes完成签到 ,获得积分10
4分钟前
Orange应助jasonwee采纳,获得10
4分钟前
科研通AI2S应助科研通管家采纳,获得10
4分钟前
熊雅完成签到,获得积分10
4分钟前
4分钟前
chongchong完成签到 ,获得积分10
4分钟前
阿俊1212完成签到 ,获得积分10
4分钟前
北枳完成签到,获得积分10
4分钟前
4分钟前
jasonwee发布了新的文献求助10
4分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 3000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 1100
3O - Innate resistance in EGFR mutant non-small cell lung cancer (NSCLC) patients by coactivation of receptor tyrosine kinases (RTKs) 1000
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Proceedings of the Fourth International Congress of Nematology, 8-13 June 2002, Tenerife, Spain 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5936190
求助须知:如何正确求助?哪些是违规求助? 7025799
关于积分的说明 15863763
捐赠科研通 5065243
什么是DOI,文献DOI怎么找? 2724506
邀请新用户注册赠送积分活动 1682509
关于科研通互助平台的介绍 1611623