已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Semantic guidance for precise style control in diffusion image generation

作者
Y.-R. Chang,Di Zhao,Peng Geng
出处
期刊:Scientific Reports [Springer Nature]
标识
DOI:10.1038/s41598-025-28715-x
摘要

Diffusion models excel at generating high-quality images and are easy to scale, making them highly popular among active users. Meanwhile, diffusion-based text-to-image models have demonstrated significant potential in transferring reference styles. Recently, much research has focused on decoupling the overall style and semantics of reference images, but there has been limited research on balancing style weights from one or multiple reference images. We propose a method for extracting one or more styles from one or more reference images and fusing them together for style-diverse images. We utilize the SAM model to perform semantic segmentation on reference images, extracting the desired style images, and design a parallel decoupling adapter based on an image adapter to simultaneously decouple multiple styles. Additionally, we optimize the encoder to perform more precise style extraction from style reference images while ensuring that style information is not lost. Our method enables multi-visual style prompting without any fine-tuning, and the intensity of each style is controllable. Furthermore, our work demonstrates outstanding visual stylization results, achieving the best balance between style intensity and the controllability of textual elements.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
建议保存本图,每天支付宝扫一扫(相册选取)领红包
实时播报
老实的南风完成签到 ,获得积分10
3秒前
xhh完成签到,获得积分10
4秒前
jetwang发布了新的文献求助10
6秒前
7秒前
菲菲完成签到 ,获得积分10
7秒前
田様应助弋沨采纳,获得10
10秒前
12秒前
HuiYmao发布了新的文献求助10
12秒前
13秒前
16秒前
Amor发布了新的文献求助10
18秒前
22秒前
华仔应助shuidajiao采纳,获得10
23秒前
Amor完成签到,获得积分10
23秒前
iorpi完成签到,获得积分10
24秒前
taiyan完成签到,获得积分10
25秒前
28秒前
mphla完成签到,获得积分10
30秒前
link发布了新的文献求助10
32秒前
34秒前
幽默的妍完成签到 ,获得积分10
34秒前
羞涩的傲菡完成签到,获得积分10
35秒前
浮游应助科研通管家采纳,获得10
36秒前
Jasper应助科研通管家采纳,获得10
36秒前
浮游应助科研通管家采纳,获得10
36秒前
yyds应助科研通管家采纳,获得50
36秒前
36秒前
38秒前
40秒前
OvO_4577发布了新的文献求助10
41秒前
42秒前
pililili发布了新的文献求助10
45秒前
黑土完成签到 ,获得积分10
46秒前
孤独的根号3完成签到,获得积分10
46秒前
49秒前
renjijiefuli发布了新的文献求助50
53秒前
文欣完成签到 ,获得积分0
53秒前
研友_8RyzBZ完成签到,获得积分10
54秒前
1分钟前
Hhhhh完成签到 ,获得积分10
1分钟前
高分求助中
Learning and Memory: A Comprehensive Reference 2000
Predation in the Hymenoptera: An Evolutionary Perspective 1800
List of 1,091 Public Pension Profiles by Region 1541
The Jasper Project 800
Holistic Discourse Analysis 600
Beyond the sentence: discourse and sentential form / edited by Jessica R. Wirth 600
Binary Alloy Phase Diagrams, 2nd Edition 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5502564
求助须知:如何正确求助?哪些是违规求助? 4598355
关于积分的说明 14463932
捐赠科研通 4531953
什么是DOI,文献DOI怎么找? 2483736
邀请新用户注册赠送积分活动 1466943
关于科研通互助平台的介绍 1439576