已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Evaluation of large language models for discovery of gene set function

基因命名 集合(抽象数据类型) 功能基因组学 管道(软件) 背景(考古学) 基因组学 功能(生物学) 计算生物学 基因本体论 基因 计算机科学 标杆管理 基因注释 本体论 生物 遗传学 基因表达 基因组 程序设计语言 业务 古生物学 哲学 营销 认识论 命名法 植物 分类学(生物学)
作者
Dexter Pratt,Mengzhou Hu,Sahar Alkhairy,Ingoo Lee,Rudolf Pillich,Robin E. Bachelder,Trey Ideker
出处
期刊:Research Square 被引量:9
标识
DOI:10.21203/rs.3.rs-3270331/v1
摘要

Gene set analysis is a mainstay of functional genomics, but it relies on manually curated databases of gene functions that are incomplete and unaware of biological context. Here we evaluate the ability of OpenAI's GPT-4, a Large Language Model (LLM), to develop hypotheses about common gene functions from its embedded biomedical knowledge. We created a GPT-4 pipeline to label gene sets with names that summarize their consensus functions, substantiated by analysis text and citations. Benchmarking against named gene sets in the Gene Ontology, GPT-4 generated very similar names in 50% of cases, while in most remaining cases it recovered the name of a more general concept. In gene sets discovered in 'omics data, GPT-4 names were more informative than gene set enrichment, with supporting statements and citations that largely verified in human review. The ability to rapidly synthesize common gene functions positions LLMs as valuable functional genomics assistants.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
zhang568完成签到 ,获得积分10
1秒前
1秒前
EDTA完成签到,获得积分10
3秒前
子平完成签到 ,获得积分0
3秒前
4秒前
qls123发布了新的文献求助10
4秒前
mmmxuuuuan完成签到,获得积分10
4秒前
Liu完成签到,获得积分20
5秒前
闪闪的小小完成签到 ,获得积分10
7秒前
Liu发布了新的文献求助10
8秒前
呆萌井完成签到,获得积分10
8秒前
拓扑超导相变完成签到 ,获得积分10
9秒前
王欣瑶完成签到 ,获得积分10
9秒前
ouou发布了新的文献求助10
9秒前
14秒前
李佳霖发布了新的文献求助10
14秒前
隐形大白完成签到,获得积分10
17秒前
18秒前
18秒前
18秒前
qls123完成签到,获得积分10
19秒前
破碎虚空发布了新的文献求助10
19秒前
22秒前
向寒光发布了新的文献求助10
22秒前
华仔应助平淡的河马采纳,获得10
22秒前
酷波er应助科研通管家采纳,获得10
23秒前
小乐应助科研通管家采纳,获得20
23秒前
23秒前
23秒前
zLin发布了新的文献求助30
25秒前
30秒前
33秒前
33秒前
OK应助昏睡的金毛采纳,获得10
35秒前
我是老大应助vivi采纳,获得10
36秒前
爱你哦完成签到,获得积分10
36秒前
种喜欢的花完成签到 ,获得积分20
37秒前
CHSLN发布了新的文献求助10
38秒前
lv应助膜王采纳,获得10
40秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Graphene Handbook (2019 Edition) 800
Adhesion Science: Principles & Practice 800
Signals, Systems, and Signal Processing 610
IEST-RP-CC018: Cleanroom Cleaning and Sanitization: Operating and Monitoring Procedures 600
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6534447
求助须知:如何正确求助?哪些是违规求助? 8327781
关于积分的说明 17839390
捐赠科研通 5636105
什么是DOI,文献DOI怎么找? 2934362
邀请新用户注册赠送积分活动 1910712
关于科研通互助平台的介绍 1769161