亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Identifying artificial intelligence–generated content in online Q&A communities through interpretable machine learning

内容(测量理论) 人工智能 计算机科学 自然语言处理 机器学习 情报检索 心理学 数据科学 数学 数学分析
作者
Qingqing Li,Ziming Zeng,Tingting Li,Shouqiang Sun
出处
期刊:Journal of Information Science [SAGE Publishing]
被引量:6
标识
DOI:10.1177/01655515241281491
摘要

This study aims to construct a comprehensive feature system for identifying artificial intelligence–generated content (AIGC) in online Q&A communities, thus uncovering the key factors and mechanisms influencing the identification of AIGC. First, based on the theory of systemic functional linguistics (SFL) and information quality (IQ), this article extracts vocabulary, content, structure, and emotional features from the text, and identifies the AIGC through nine mainstream machine learning algorithms. Subsequently, three widely used resampling strategies are exploited to address the category imbalance problem. The grid search optimisation algorithm fine-tunes different combinations of parameters to improve the performance of the identification classifier. Finally, SHAP values are introduced to evaluate and elucidate the global feature importance and feature influence mechanism. A Chinese corpus from the Zhihu Q&A community is constructed to verify the validity of these methods. The experimental results show that the eXtreme Gradient Boosting (XGBoost) model optimised with hybrid sampling and grid search parameters exhibits excellent performance in identifying AI-generated text, which achieves an F 1 -score of 0.9935, an improvement of 0.11 percentage points over the original model. In addition, all four dimensions of features constructed in this article contribute to AI-generated text identification, and the results of feature interpretability analysis show the greatest impact of features that focus on content readability. The study facilitates the identification and labelling of AIGC in online Q&A communities, thereby enhancing transparency and accountability of information shared online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
11秒前
18秒前
21秒前
26秒前
木有完成签到 ,获得积分0
47秒前
tianya完成签到,获得积分10
49秒前
ybbb完成签到 ,获得积分10
53秒前
54秒前
嘻嘻哈哈应助科研通管家采纳,获得10
54秒前
嘻嘻哈哈应助科研通管家采纳,获得10
54秒前
Lucas应助科研通管家采纳,获得10
54秒前
ding应助科研通管家采纳,获得10
54秒前
1分钟前
陌陌完成签到 ,获得积分10
1分钟前
煊陌完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
唐礼祥发布了新的文献求助10
1分钟前
1分钟前
欣欣完成签到,获得积分10
1分钟前
1分钟前
Willow发布了新的文献求助10
2分钟前
Snmmer发布了新的文献求助10
2分钟前
dzjin完成签到,获得积分10
2分钟前
我爱科研发布了新的文献求助10
2分钟前
2分钟前
非洲大象完成签到,获得积分10
2分钟前
2分钟前
唐礼祥完成签到,获得积分10
2分钟前
我是老大应助小海采纳,获得10
2分钟前
幽忆香发布了新的文献求助10
2分钟前
2分钟前
2分钟前
科研通AI6.1应助四维虫子采纳,获得10
2分钟前
2分钟前
2分钟前
幽忆香完成签到,获得积分10
2分钟前
2分钟前
高分求助中
Clinical Epidemiology: The Essentials, 6e 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Graphene Handbook (2019 Edition) 800
Adhesion Science: Principles & Practice 800
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6550361
求助须知:如何正确求助?哪些是违规求助? 8336913
关于积分的说明 17863508
捐赠科研通 5663573
什么是DOI,文献DOI怎么找? 2938833
邀请新用户注册赠送积分活动 1914863
关于科研通互助平台的介绍 1781359