DiffI2I: Efficient Diffusion Model for Image-to-Image Translation

人工智能 翻译(生物学) 计算机科学 图像翻译 图像(数学) 计算机视觉 图像处理 图像配准 模式识别(心理学) 图像分割 生物化学 化学 信使核糖核酸 基因
作者
Bin Xia,Yulun Zhang,Shiyin Wang,Yitong Wang,Xinglong Wu,Yapeng Tian,Wenming Yang,Radu Timotfe,Luc Van Gool
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:47 (3): 1578-1593 被引量:2
标识
DOI:10.1109/tpami.2024.3498003
摘要

The Diffusion Model (DM) has emerged as the SOTA approach for image synthesis. However, the existing DM cannot perform well on some image-to-image translation (I2I) tasks. Different from image synthesis, some I2I tasks, such as super-resolution, require generating results in accordance with GT images. Traditional DMs for image synthesis require extensive iterations and large denoising models to estimate entire images, which gives their strong generative ability but also leads to artifacts and inefficiency for I2I. To tackle this challenge, we propose a simple, efficient, and powerful DM framework for I2I, called DiffI2I. Specifically, DiffI2I comprises three key components: a compact I2I prior extraction network (CPEN), a dynamic I2I transformer (DI2Iformer), and a denoising network. We train DiffI2I in two stages: pretraining and DM training. For pretraining, GT and input images are fed into CPEN to capture a compact I2I prior representation (IPR) guiding DI2Iformer. In the second stage, the DM is trained to only use the input images to estimate the same IRP as CPEN. Compared to traditional DMs, the compact IPR enables DiffI2I to obtain more accurate outcomes and employ a lighter denoising network and fewer iterations. Through extensive experiments on various I2I tasks, we demonstrate that DiffI2I achieves SOTA performance while significantly reducing computational burdens.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
潇洒的白昼完成签到,获得积分10
刚刚
Weiyu完成签到 ,获得积分10
刚刚
Estella完成签到,获得积分10
1秒前
英俊的铭应助黄垚采纳,获得10
1秒前
千流完成签到,获得积分10
1秒前
独特的凝云完成签到 ,获得积分10
1秒前
1秒前
oblivious完成签到,获得积分10
2秒前
闪闪星星完成签到,获得积分10
2秒前
东西南北完成签到,获得积分10
3秒前
3秒前
传奇3应助Daria采纳,获得10
3秒前
3秒前
4秒前
4秒前
聪明胡图图完成签到,获得积分10
4秒前
一一完成签到,获得积分10
4秒前
4秒前
lxt完成签到,获得积分10
5秒前
yin完成签到,获得积分10
5秒前
zyq发布了新的文献求助10
6秒前
喜悦向日葵完成签到 ,获得积分10
6秒前
小乐发布了新的文献求助10
7秒前
荣冥幽发布了新的文献求助10
7秒前
OFish完成签到,获得积分10
8秒前
小白完成签到 ,获得积分10
8秒前
阿冷完成签到,获得积分10
8秒前
田様应助PSCs采纳,获得10
9秒前
wqwqwqwqwq发布了新的文献求助10
9秒前
HAHA完成签到,获得积分10
10秒前
futianyu完成签到 ,获得积分0
10秒前
不安的元霜完成签到,获得积分10
12秒前
mol完成签到,获得积分10
12秒前
鳗鱼千雁完成签到,获得积分10
14秒前
14秒前
Dank1ng完成签到,获得积分10
15秒前
15秒前
wind2631完成签到,获得积分10
15秒前
15秒前
Magic1987完成签到,获得积分10
16秒前
高分求助中
Mass producing individuality 600
Algorithmic Mathematics in Machine Learning 500
Разработка метода ускоренного контроля качества электрохромных устройств 500
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
NK Cell Receptors: Advances in Cell Biology and Immunology by Colton Williams (Editor) 200
Effect of clapping movement with groove rhythm on executive function: focusing on audiomotor entrainment 200
The Oxford Handbook of Video Game Music and Sound 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3827509
求助须知:如何正确求助?哪些是违规求助? 3369757
关于积分的说明 10457657
捐赠科研通 3089465
什么是DOI,文献DOI怎么找? 1699897
邀请新用户注册赠送积分活动 817560
科研通“疑难数据库(出版商)”最低求助积分说明 770263