SMILES-BERT

人工智能 一般化 机器学习 深度学习 计算机科学 标记数据 变压器 深层神经网络 训练集 人工神经网络 比例(比率) 任务(项目管理) 财产(哲学) 认识论 物理 数学分析 哲学 量子力学 经济 电压 管理 数学
作者
Sheng Wang,Yuzhi Guo,Yuhong Wang,Hongmao Sun,Junzhou Huang
出处
期刊:International Conference on Bioinformatics 卷期号:: 429-436 被引量:250
标识
DOI:10.1145/3307339.3342186
摘要

With the rapid progress of AI in both academia and industry, Deep Learning has been widely introduced into various areas in drug discovery to accelerate its pace and cut R&D costs. Among all the problems in drug discovery, molecular property prediction has been one of the most important problems. Unlike general Deep Learning applications, the scale of labeled data is limited in molecular property prediction. To better solve this problem, Deep Learning methods have started focusing on how to utilize tremendous unlabeled data to improve the prediction performance on small-scale labeled data. In this paper, we propose a semi-supervised model named SMILES-BERT, which consists of attention mechanism based Transformer Layer. A large-scale unlabeled data has been used to pre-train the model through a Masked SMILES Recovery task. Then the pre-trained model could easily be generalized into different molecular property prediction tasks via fine-tuning. In the experiments, the proposed SMILES-BERT outperforms the state-of-the-art methods on all three datasets, showing the effectiveness of our unsupervised pre-training and great generalization capability of the pre-trained model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
song完成签到,获得积分10
刚刚
cdercder应助科研通管家采纳,获得10
刚刚
华仔应助科研通管家采纳,获得10
刚刚
cdercder应助科研通管家采纳,获得10
刚刚
科研通AI2S应助科研通管家采纳,获得10
刚刚
完美世界应助科研通管家采纳,获得10
刚刚
2秒前
鳗鱼不尤完成签到,获得积分10
4秒前
4秒前
蓝色发布了新的文献求助10
4秒前
orixero应助辛勤的又亦采纳,获得10
5秒前
啊啊啊发布了新的文献求助10
6秒前
xiubo128完成签到 ,获得积分10
9秒前
一个舒完成签到,获得积分10
10秒前
汉堡包应助昏睡的念之采纳,获得10
11秒前
王大宝宝宝完成签到 ,获得积分10
12秒前
WZ完成签到,获得积分10
13秒前
陶世立完成签到 ,获得积分10
13秒前
花无双完成签到,获得积分0
13秒前
14秒前
17秒前
科研通AI5应助Fin2046采纳,获得10
19秒前
21秒前
传奇3应助gyd采纳,获得10
21秒前
22秒前
科研通AI5应助Solar energy采纳,获得10
23秒前
蓝色发布了新的文献求助10
23秒前
Jasper应助研友_8yN60L采纳,获得10
24秒前
江峰发布了新的文献求助10
27秒前
乔123完成签到,获得积分10
27秒前
empty发布了新的文献求助10
29秒前
30秒前
32秒前
常佳楠完成签到,获得积分10
33秒前
33秒前
七碗茶发布了新的文献求助10
33秒前
小二郎应助妩媚的魂幽采纳,获得10
34秒前
常佳楠发布了新的文献求助10
36秒前
科研通AI5应助江峰采纳,获得10
36秒前
蓝色发布了新的文献求助10
36秒前
高分求助中
Basic Discrete Mathematics 1000
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3799095
求助须知:如何正确求助?哪些是违规求助? 3344848
关于积分的说明 10321650
捐赠科研通 3061268
什么是DOI,文献DOI怎么找? 1680100
邀请新用户注册赠送积分活动 806904
科研通“疑难数据库(出版商)”最低求助积分说明 763445