Identifying promoter and enhancer sequences by graph convolutional networks

增强子 水准点(测量) 图形 计算机科学 人工智能 边距(机器学习) 编码 机器学习 生物 遗传学 理论计算机科学 基因 基因表达 大地测量学 地理
作者
Samet Tenekeci,Selma Tekir
出处
期刊:Computational Biology and Chemistry [Elsevier]
卷期号:: 108040-108040
标识
DOI:10.1016/j.compbiolchem.2024.108040
摘要

Identification of promoters, enhancers, and their interactions helps understand genetic regulation. This study proposes a graph-based semi-supervised learning model (GCN4EPI) for the enhancer-promoter classification problem. We adopt a graph convolutional network (GCN) architecture to integrate interaction information with sequence features. Nodes of the constructed graph hold word embeddings of DNA sequences while edges hold the Enhancer-Promoter Interaction (EPI) information. By means of semi-supervised learning, much less data (16%) and time are needed in model training. Comparisons on a benchmark dataset of six human cell lines show that the proposed approach outperforms the state-of-the-art methods by a large margin (10% higher F1 score) and has the fastest training time (up to 3 times). Moreover, GCN4EPI's performance on cross-cell line data is also better than the baselines (3% higher F1 score). Our qualitative analyses with graph explainability models prove that GCN4EPI learns from both text and graph structure. The results suggest that integrating interaction information with sequence features improves predictive performance and compensates for the number of training instances.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
RYAN完成签到,获得积分10
刚刚
杨冲发布了新的文献求助10
刚刚
gf完成签到,获得积分10
2秒前
夜无眠发布了新的文献求助10
3秒前
雨天完成签到,获得积分10
6秒前
QQ应助才啊采纳,获得20
6秒前
香蕉觅云应助刘浩然采纳,获得10
11秒前
夜无眠完成签到,获得积分10
12秒前
MiaYe发布了新的文献求助30
13秒前
周青春偶像完成签到 ,获得积分10
13秒前
鹏鹏完成签到,获得积分10
14秒前
研友_nVNBVn发布了新的文献求助10
17秒前
17秒前
Jasper应助xingstar采纳,获得10
17秒前
领导范儿应助科研通管家采纳,获得10
18秒前
我是老大应助科研通管家采纳,获得10
18秒前
汉堡包应助科研通管家采纳,获得10
18秒前
Maestro_S应助科研通管家采纳,获得10
18秒前
完美世界应助科研通管家采纳,获得10
18秒前
18秒前
天天快乐应助科研通管家采纳,获得10
18秒前
香蕉觅云应助科研通管家采纳,获得10
18秒前
18秒前
汉堡包应助科研通管家采纳,获得10
18秒前
慕青应助科研通管家采纳,获得10
18秒前
18秒前
18秒前
脑洞疼应助科研通管家采纳,获得10
18秒前
乐乐应助科研通管家采纳,获得10
19秒前
21秒前
万能图书馆应助jw采纳,获得10
23秒前
研友_nVNBVn完成签到,获得积分10
23秒前
斜杆青年发布了新的文献求助30
24秒前
25秒前
木子一发布了新的文献求助10
26秒前
所所应助Chaffee采纳,获得10
26秒前
xingstar发布了新的文献求助10
28秒前
29秒前
胖一发布了新的文献求助30
30秒前
香菜完成签到,获得积分10
30秒前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
[Echocardiography and tissue Doppler imaging in assessment of haemodynamics in patients with idiopathic, premature ventricular complexes] 600
The role of a multidrug-resistance gene (lemdrl) in conferring vinblastine resistance in Leishmania enriettii 310
Aspects of Babylonian Celestial Divination : The Lunar Eclipse Tablets of Enuma Anu Enlil 300
機能營養學前瞻(3 Ed.) 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2511920
求助须知:如何正确求助?哪些是违规求助? 2160631
关于积分的说明 5533505
捐赠科研通 1881061
什么是DOI,文献DOI怎么找? 935981
版权声明 564252
科研通“疑难数据库(出版商)”最低求助积分说明 499799