亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Prompt-Image-Caption Consistency for AI-Generated Image Quality Assessment

计算机科学 一致性(知识库) 人工智能 水准点(测量) 嵌入 生成语法 质量(理念) 图像质量 图像(数学) 基线(sea) 特征(语言学) 感知 编码(集合论) 机器学习 生成模型 模式识别(心理学) 质量得分 数据挖掘 特征提取 质量评定 源代码 计算机视觉 深度学习 上下文图像分类
作者
Wen Sun,Chaofeng Chen,Liang Liao,W. N. Lin
出处
期刊:IEEE Transactions on Multimedia [Institute of Electrical and Electronics Engineers]
卷期号:: 1-11
标识
DOI:10.1109/tmm.2026.3668530
摘要

With the advancement of generative AI, generative models such as Generative Adversarial Networks (GANs) and diffusion-based models have significantly enhanced the capabilities in generating photorealistic images. Despite significant progress in AI-Generated Images (AIGIs), the evaluation of AIGI quality remains underexplored in multiple aspects, including AI artifacts, unnatural content, and the availability of input text prompts. However, existing methods are insufficient to capture both feature representations and correlations between image and text for AIGI quality assessment in aspects of perceptual image quality and text-to-image alignment. To address this, we proposed a novel Prompt-Image-Caption Consistency (PICC) framework, designed to adapt a pre-trained vision-language model for AIGI quality assessment by considering both perceptual image quality and text-to-image alignment at the same time. This framework effectively explores the prompt-image-caption triplet by adapting image embedding and multimodal embedding via Quality-Aware Attention to capture quality-aware features and calculating consistency scores to build the correlations among the prompt, image, and caption. Additionally, we propose a multilevel strategy to integrate both local and global information from multiple prompt-image-caption triplets, further enhancing prediction performance. Extensive experiments on benchmark datasets, including AIGIQA-20K and AGIQA-3K, demonstrate that the proposed PICC achieves state-of-the-art performance compared to baseline methods. The code will be made publicly available.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
7秒前
zhangyimg发布了新的文献求助30
14秒前
科研通AI2S应助科研通管家采纳,获得10
41秒前
缓慢怜菡应助科研通管家采纳,获得20
41秒前
51秒前
xxxy发布了新的文献求助10
57秒前
1分钟前
xxxy完成签到,获得积分20
1分钟前
CQUw发布了新的文献求助10
1分钟前
乐乐应助CQUw采纳,获得10
1分钟前
su完成签到 ,获得积分10
1分钟前
pete发布了新的文献求助10
2分钟前
思源应助欢呼的小熊猫采纳,获得10
2分钟前
2分钟前
2分钟前
Hello应助科研通管家采纳,获得10
2分钟前
skotrie189完成签到,获得积分10
2分钟前
jewel9完成签到,获得积分10
2分钟前
要减肥的春天完成签到,获得积分10
3分钟前
AliEmbark完成签到,获得积分10
3分钟前
臭鼬完成签到,获得积分10
3分钟前
QJQ完成签到 ,获得积分10
3分钟前
3分钟前
璐璐在这完成签到,获得积分10
3分钟前
璐璐在这发布了新的文献求助10
3分钟前
共享精神应助紫之灵采纳,获得10
3分钟前
3分钟前
脑洞疼应助璐璐在这采纳,获得10
3分钟前
4分钟前
俭朴宛丝发布了新的文献求助10
4分钟前
4分钟前
4分钟前
璐璐在这发布了新的文献求助10
4分钟前
CQUw发布了新的文献求助10
4分钟前
4分钟前
JamesPei应助pete采纳,获得10
4分钟前
紫之灵发布了新的文献求助10
4分钟前
4分钟前
4分钟前
pete发布了新的文献求助10
4分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
Research Methods for Applied Linguistics 500
Picture Books with Same-sex Parented Families Unintentional Censorship 444
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6413872
求助须知:如何正确求助?哪些是违规求助? 8232568
关于积分的说明 17476350
捐赠科研通 5466570
什么是DOI,文献DOI怎么找? 2888390
邀请新用户注册赠送积分活动 1865164
关于科研通互助平台的介绍 1703156