Complementary multi-modality molecular self-supervised learning via non-overlapping masking for property prediction

计算机科学 模态(人机交互) 模式 人工智能 遮罩(插图) 机器学习 图形 特征学习 财产(哲学) 训练集 理论计算机科学 认识论 哲学 艺术 社会学 视觉艺术 社会科学
作者
Ao Shen,Mingzhi Yuan,Yingfan Ma,Jie Du,Manning Wang
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (4) 被引量:2
标识
DOI:10.1093/bib/bbae256
摘要

Abstract Self-supervised learning plays an important role in molecular representation learning because labeled molecular data are usually limited in many tasks, such as chemical property prediction and virtual screening. However, most existing molecular pre-training methods focus on one modality of molecular data, and the complementary information of two important modalities, SMILES and graph, is not fully explored. In this study, we propose an effective multi-modality self-supervised learning framework for molecular SMILES and graph. Specifically, SMILES data and graph data are first tokenized so that they can be processed by a unified Transformer-based backbone network, which is trained by a masked reconstruction strategy. In addition, we introduce a specialized non-overlapping masking strategy to encourage fine-grained interaction between these two modalities. Experimental results show that our framework achieves state-of-the-art performance in a series of molecular property prediction tasks, and a detailed ablation study demonstrates efficacy of the multi-modality framework and the masking strategy.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
吃瓜落后者完成签到,获得积分10
2秒前
FPGA发布了新的文献求助100
2秒前
ding应助东郭翰采纳,获得10
3秒前
舒适月饼发布了新的文献求助20
4秒前
赘婿应助tengfei采纳,获得10
5秒前
skyleon完成签到,获得积分10
10秒前
搞怪世德完成签到,获得积分10
10秒前
12秒前
hill完成签到,获得积分10
12秒前
12秒前
852应助ww采纳,获得10
12秒前
huhuhu发布了新的文献求助10
14秒前
田様应助Ericnth采纳,获得10
16秒前
舒适月饼完成签到,获得积分10
16秒前
dy发布了新的文献求助10
16秒前
16秒前
16秒前
17秒前
18秒前
ww完成签到,获得积分10
19秒前
博修发布了新的文献求助10
20秒前
Kevin Huang发布了新的文献求助10
20秒前
石石刘完成签到 ,获得积分10
20秒前
yrt发布了新的文献求助10
21秒前
光锥之外发布了新的文献求助10
21秒前
tengfei发布了新的文献求助10
21秒前
落寞凌波发布了新的文献求助10
22秒前
24秒前
研友_VZG7GZ应助聪慧的微笑采纳,获得10
24秒前
大个应助wst采纳,获得10
25秒前
26秒前
WLWLW应助地老天框采纳,获得10
26秒前
26秒前
27秒前
28秒前
科研狗完成签到 ,获得积分10
28秒前
Ericnth发布了新的文献求助10
28秒前
hh发布了新的文献求助10
28秒前
syangZ发布了新的文献求助10
28秒前
年轻人应助科研通管家采纳,获得20
29秒前
高分求助中
【请各位用户详细阅读此贴后再求助】科研通的精品贴汇总(请勿应助) 10000
【提示信息,请勿应助】关于scihub 10000
Les Mantodea de Guyane: Insecta, Polyneoptera [The Mantids of French Guiana] 3000
徐淮辽南地区新元古代叠层石及生物地层 3000
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
Research on Disturbance Rejection Control Algorithm for Aerial Operation Robots 1000
Global Eyelash Assessment scale (GEA) 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4044972
求助须知:如何正确求助?哪些是违规求助? 3582639
关于积分的说明 11387240
捐赠科研通 3309549
什么是DOI,文献DOI怎么找? 1821783
邀请新用户注册赠送积分活动 893858
科研通“疑难数据库(出版商)”最低求助积分说明 815888