CRISPRpred(SEQ): a sequence-based method for sgRNA on target activity prediction using traditional machine learning

计算机科学 人工智能 机器学习 深度学习 水准点(测量) 管道(软件) 程序设计语言 大地测量学 地理
作者
Ali Haisam Muhammad Rafid,Md. Toufikuzzaman,Mohammad Saifur Rahman,M. Sohel Rahman
出处
期刊:BMC Bioinformatics [BioMed Central]
卷期号:21 (1) 被引量:35
标识
DOI:10.1186/s12859-020-3531-9
摘要

Abstract Background The latest works on CRISPR genome editing tools mainly employs deep learning techniques. However, deep learning models lack explainability and they are harder to reproduce. We were motivated to build an accurate genome editing tool using sequence-based features and traditional machine learning that can compete with deep learning models. Results In this paper, we present CRISPRpred(SEQ), a method for sgRNA on-target activity prediction that leverages only traditional machine learning techniques and hand-crafted features extracted from sgRNA sequences. We compare the results of CRISPRpred(SEQ) with that of DeepCRISPR, the current state-of-the-art, which uses a deep learning pipeline. Despite using only traditional machine learning methods, we have been able to beat DeepCRISPR for the three out of four cell lines in the benchmark dataset convincingly (2.174%, 6.905% and 8.119% improvement for the three cell lines). Conclusion CRISPRpred(SEQ) has been able to convincingly beat DeepCRISPR in 3 out of 4 cell lines. We believe that by exploring further, one can design better features only using the sgRNA sequences and can come up with a better method leveraging only traditional machine learning algorithms that can fully beat the deep learning models.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Jasper应助友好胡萝卜采纳,获得10
2秒前
3秒前
淡定世平完成签到,获得积分10
3秒前
sdfwsdfsd完成签到,获得积分10
5秒前
liuguanfeng发布了新的文献求助10
5秒前
虚心孤风发布了新的文献求助10
6秒前
蛋蛋完成签到,获得积分10
7秒前
shuiyu发布了新的文献求助10
8秒前
l论文来完成签到,获得积分10
8秒前
ROSEANNE完成签到,获得积分10
8秒前
854fycchjh完成签到,获得积分10
9秒前
六个核桃完成签到,获得积分10
10秒前
qin完成签到,获得积分10
12秒前
张牧之完成签到 ,获得积分10
12秒前
阿豆完成签到 ,获得积分10
13秒前
阿曾完成签到 ,获得积分0
14秒前
厚德载物完成签到 ,获得积分10
16秒前
18秒前
ccccchen完成签到,获得积分10
18秒前
晚秋天完成签到 ,获得积分10
20秒前
21秒前
liuguanfeng完成签到,获得积分10
23秒前
25秒前
xl完成签到,获得积分10
26秒前
卿莞尔完成签到 ,获得积分0
27秒前
29秒前
清野完成签到 ,获得积分10
29秒前
cxjie320完成签到,获得积分10
30秒前
Atlantis完成签到,获得积分10
30秒前
gyx发布了新的文献求助10
31秒前
驿路梨花完成签到,获得积分10
31秒前
着急的延恶完成签到 ,获得积分10
32秒前
奶牛猫完成签到,获得积分10
33秒前
Barkdog完成签到,获得积分10
34秒前
36秒前
36秒前
Atlantis完成签到,获得积分10
37秒前
Yuelu完成签到 ,获得积分10
38秒前
黄卡卡完成签到,获得积分10
39秒前
木木很累发布了新的文献求助30
40秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Thermal effects on behaviour of clay–structure interface under partial drainage 500
Petrology and Plate Tectonics 500
Writing Systems 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6895389
求助须知:如何正确求助?哪些是违规求助? 8591346
关于积分的说明 18242700
捐赠科研通 6290951
什么是DOI,文献DOI怎么找? 3060255
关于科研通互助平台的介绍 2078535
邀请新用户注册赠送积分活动 2038123