Human-Guided Image Generation for Expanding Small-Scale Training Image Datasets

计算机科学 培训(气象学) 图像(数学) 人工智能 比例(比率) 计算机视觉 可视化 训练集 计算机图形学(图像) 模式识别(心理学) 地图学 物理 气象学 地理
作者
Changjian Chen,Fei Lv,Yiming Guan,Pengcheng Wang,Sheng‐Jie Yu,Yifan Zhang,Zhuo Tang
出处
期刊:IEEE Transactions on Visualization and Computer Graphics [Institute of Electrical and Electronics Engineers]
卷期号:: 1-11
标识
DOI:10.1109/tvcg.2025.3567053
摘要

The performance of computer vision models in certain real-world applications (e.g., rare wildlife observation) is limited by the small number of available images. Expanding datasets using pre-trained generative models is an effective way to address this limitation. However, since the automatic generation process is uncontrollable, the generated images are usually limited in diversity, and some of them are undesired. In this paper, we propose a human-guided image generation method for more controllable dataset expansion. We develop a multi-modal projection method with theoretical guarantees to facilitate the exploration of both the original and generated images. Based on the exploration, users refine the prompts and re-generate images for better performance. Since directly refining the prompts is challenging for novice users, we develop a sample-level prompt refinement method to make it easier. With this method, users only need to provide sample-level feedback (e.g., which samples are undesired) to obtain better prompts. The effectiveness of our method is demonstrated through the quantitative evaluation of the multi-modal projection method, improved model performance in the case study for both classification and object detection tasks, and positive feedback from the experts.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
沉默的葵阴完成签到 ,获得积分10
1秒前
1秒前
小研完成签到,获得积分10
1秒前
史雅柏完成签到,获得积分20
1秒前
科目三应助cheong采纳,获得10
1秒前
青春发布了新的文献求助10
2秒前
xixi890430发布了新的文献求助10
2秒前
anan发布了新的文献求助10
2秒前
科研通AI6.1应助ybk666采纳,获得10
2秒前
2秒前
2秒前
滴嘟滴嘟发布了新的文献求助10
2秒前
2秒前
小尹应助Ace_killer采纳,获得10
3秒前
3秒前
3秒前
wangyan完成签到,获得积分10
3秒前
李小强完成签到,获得积分10
3秒前
liao完成签到,获得积分10
3秒前
木头发布了新的文献求助10
3秒前
4秒前
帅哥吴克发布了新的文献求助10
6秒前
健壮的鸽子完成签到,获得积分10
6秒前
鲜艳的半梦完成签到,获得积分10
6秒前
共享精神应助luofeng采纳,获得10
6秒前
大空翼发布了新的文献求助10
6秒前
沫栀发布了新的文献求助10
7秒前
dora发布了新的文献求助10
7秒前
脑洞疼应助无情芷珊采纳,获得10
7秒前
无极微光应助震动的听安采纳,获得20
7秒前
涨涨涨发布了新的文献求助10
7秒前
爱听歌发布了新的文献求助10
8秒前
NexusExplorer应助追寻茗采纳,获得10
8秒前
斯文败类应助曲艺采纳,获得10
8秒前
songurt发布了新的文献求助10
8秒前
8秒前
烁硕完成签到,获得积分10
8秒前
8秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6442770
求助须知:如何正确求助?哪些是违规求助? 8256642
关于积分的说明 17583261
捐赠科研通 5501353
什么是DOI,文献DOI怎么找? 2900675
邀请新用户注册赠送积分活动 1877632
关于科研通互助平台的介绍 1717328