亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

A Generic Semi-Supervised and Active Learning Framework for Biomedical Text Classification

机器学习 人工智能 分类器(UML) 计算机科学 半监督学习 标记数据 监督学习 共同训练 代表性启发 人工神经网络 数学 统计
作者
Christopher A. Flores,Rodrigo Verschae
标识
DOI:10.1109/embc48229.2022.9871846
摘要

Biomedical text classification requires having training examples labeled by clinical specialists, a process that can be costly. To address this problem, active learning incrementally selects a subset of the most informative unlabeled examples, samples that are then labeled and used to train a given classifier, seeking to reduce the number of labeled samples. Nonetheless, the other unlabeled examples are not used by active learning, but incorporating semi-supervised techniques that use unlabeled samples could improve the representativeness of the data and the discriminatory power of the classifiers. This work proposes a generic semi-supervised learning framework for improving active learning and reducing the number of labeled training examples in biomedical text classification. The proposed framework combines manually annotated training examples selected by active learning and pseudo-labels obtained from a trained classifier. To evaluate the proposed framework, three biomedical datasets with textual information on obesity and smoking habit were used across different classification algorithms. The classification results show that the proposed framework can reduce the number of training examples that are manually labeled by clinical specialists by a 10% without affecting the performance of the classifiers. This performance is attributable to the ability of the classifiers to correctly select and label the training examples. Clinical relevance- We demonstrate the effectiveness of the proposed semi-supervised learning framework to reduce manual labeling efforts of biomedical texts by clinical specialists for the training of classifiers.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
STEAD完成签到,获得积分10
31秒前
LMF完成签到 ,获得积分10
38秒前
Hello应助赫赫采纳,获得10
45秒前
56秒前
1分钟前
1分钟前
LSYLIZ发布了新的文献求助10
1分钟前
cdhuang发布了新的文献求助10
1分钟前
英俊的铭应助LSYLIZ采纳,获得10
1分钟前
壮观溪流完成签到 ,获得积分10
1分钟前
cdhuang完成签到,获得积分10
1分钟前
1分钟前
傲娇老五发布了新的文献求助10
1分钟前
HCCha完成签到,获得积分10
2分钟前
石石刘完成签到 ,获得积分10
2分钟前
彩虹儿完成签到,获得积分0
3分钟前
3分钟前
xxxxxxh发布了新的文献求助10
4分钟前
xxxxxxh完成签到,获得积分10
4分钟前
4分钟前
方沅发布了新的文献求助30
4分钟前
4分钟前
walter发布了新的文献求助10
4分钟前
盼芙完成签到 ,获得积分10
4分钟前
方沅完成签到,获得积分10
4分钟前
5分钟前
傲娇老五发布了新的文献求助10
5分钟前
5分钟前
Pinocchior发布了新的文献求助30
5分钟前
科研通AI5应助Pinocchior采纳,获得30
5分钟前
Pinocchior完成签到,获得积分10
5分钟前
Jayzie完成签到 ,获得积分10
6分钟前
6分钟前
赫赫发布了新的文献求助10
6分钟前
tutu完成签到,获得积分10
7分钟前
宅心仁厚完成签到 ,获得积分10
7分钟前
小马甲应助bbband采纳,获得10
8分钟前
依然灬聆听完成签到,获得积分10
8分钟前
9分钟前
bbband发布了新的文献求助10
9分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 800
求中国石油大学(北京)图书馆的硕士论文,作者董晨,十年前搞太赫兹的 500
Vertebrate Palaeontology, 5th Edition 500
Narrative Method and Narrative form in Masaccio's Tribute Money 500
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4773549
求助须知:如何正确求助?哪些是违规求助? 4107088
关于积分的说明 12704465
捐赠科研通 3827409
什么是DOI,文献DOI怎么找? 2111637
邀请新用户注册赠送积分活动 1135594
关于科研通互助平台的介绍 1018618