清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

On the effectiveness of pretrained models for API learning

计算机科学 自然语言处理 人工智能 自然语言 语言模型 词汇分析 任务(项目管理) 情报检索 背景(考古学) 编码器 答疑 变压器 自动汇总 解析 编码 程序设计语言 古生物学 生物化学 化学 物理 管理 量子力学 电压 基因 经济 生物 操作系统
作者
M.A. Hadi,Imam Nur Bani Yusuf,Ferdian Thung,Kien Gia Luong,Lingxiao Jiang,Fatemeh H. Fard,David Lo
标识
DOI:10.1145/3524610.3527886
摘要

Developers frequently use APIs to implement certain functionalities, such as parsing Excel Files, reading and writing text files line by line, etc. Developers can greatly benefit from automatic API usage sequence generation based on natural language queries for building applications in a faster and cleaner manner. Existing approaches utilize information retrieval models to search for matching API sequences given a query or use RNN-based encoder-decoder to generate API sequences. As it stands, the first approach treats queries and API names as bags of words. It lacks deep comprehension of the semantics of the queries. The latter approach adapts a neural language model to encode a user query into a fixed-length context vector and generate API sequences from the context vector. We want to understand the effectiveness of recent Pre-trained Transformer based Models (PTMs) for the API learning task. These PTMs are trained on large natural language corpora in an unsupervised manner to retain contextual knowledge about the language and have found success in solving similar Natural Language Processing (NLP) problems. However, the applicability of PTMs has not yet been explored for the API sequence generation task. We use a dataset that contains 7 million annotations collected from GitHub to evaluate the PTMs empirically. This dataset was also used to assess previous approaches. Based on our results, PTMs generate more accurate API sequences and outperform other related methods by around 11%. We have also identified two different tokenization approaches that can contribute to a significant boost in PTMs' performance for the API sequence generation task.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
故意的书本完成签到 ,获得积分10
1秒前
晴空万里完成签到 ,获得积分10
11秒前
梦梦的小可爱完成签到 ,获得积分10
27秒前
31秒前
herpes完成签到 ,获得积分0
35秒前
Meng完成签到,获得积分10
35秒前
MADAO完成签到 ,获得积分10
42秒前
SCI完成签到 ,获得积分10
43秒前
拼搏的羊青完成签到,获得积分10
44秒前
zyp应助科研通管家采纳,获得10
45秒前
无花果应助科研通管家采纳,获得10
45秒前
cdercder应助科研通管家采纳,获得10
45秒前
笨笨完成签到 ,获得积分10
56秒前
顾矜应助persist采纳,获得10
1分钟前
一直会飞的猪完成签到 ,获得积分10
1分钟前
敞敞亮亮完成签到 ,获得积分10
1分钟前
1分钟前
Jiangzy完成签到,获得积分10
1分钟前
persist发布了新的文献求助10
1分钟前
巴山夜雨完成签到,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
yiren完成签到 ,获得积分10
1分钟前
ramsey33完成签到 ,获得积分10
1分钟前
研友_8y2G0L完成签到,获得积分10
1分钟前
合适醉蝶完成签到 ,获得积分10
1分钟前
yanmh完成签到,获得积分10
2分钟前
猪猪完成签到 ,获得积分10
2分钟前
爱学习的悦悦子完成签到 ,获得积分10
2分钟前
persist完成签到,获得积分10
2分钟前
黑粉头头完成签到,获得积分10
2分钟前
水晶李完成签到 ,获得积分10
2分钟前
raiychemj完成签到,获得积分10
2分钟前
Hina完成签到,获得积分0
2分钟前
lixiang完成签到 ,获得积分10
2分钟前
Serein完成签到,获得积分10
2分钟前
大轩完成签到 ,获得积分10
2分钟前
木木杨完成签到,获得积分10
2分钟前
cdercder应助科研通管家采纳,获得10
2分钟前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
Images that translate 500
Transnational East Asian Studies 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843292
求助须知:如何正确求助?哪些是违规求助? 3385538
关于积分的说明 10540750
捐赠科研通 3106152
什么是DOI,文献DOI怎么找? 1710900
邀请新用户注册赠送积分活动 823818
科研通“疑难数据库(出版商)”最低求助积分说明 774308