Distributed Representations of Words and Phrases and their Compositionality

组合性原则 计算机科学 Softmax函数 词(群论) 自然语言处理 人工智能 简单(哲学) 质量(理念) 语义学(计算机科学) 加速 语言学 人工神经网络 认识论 操作系统 哲学 程序设计语言
作者
Tomáš Mikolov,Ilya Sutskever,Kai Chen,Greg S. Corrado,Jeff Dean
出处
期刊:Cornell University - arXiv 卷期号:26: 3111-3119 被引量:18060
标识
DOI:10.48550/arxiv.1310.4546
摘要

The recently introduced continuous Skip-gram model is an efficient method for learning high-quality distributed vector representations that capture a large number of precise syntactic and semantic word relationships. In this paper we present several extensions that improve both the quality of the vectors and the training speed. By subsampling of the frequent words we obtain significant speedup and also learn more regular word representations. We also describe a simple alternative to the hierarchical softmax called negative sampling. An inherent limitation of word representations is their indifference to word order and their inability to represent idiomatic phrases. For example, the meanings of "Canada" and "Air" cannot be easily combined to obtain "Air Canada". Motivated by this example, we present a simple method for finding phrases in text, and show that learning good vector representations for millions of phrases is possible.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
charint发布了新的文献求助10
1秒前
1秒前
1秒前
ru发布了新的文献求助10
2秒前
soiiixi发布了新的文献求助10
2秒前
2秒前
Huibo发布了新的文献求助10
3秒前
大模型应助正直尔曼采纳,获得30
3秒前
吼吼哈哈完成签到,获得积分10
5秒前
hhhhhhhh完成签到,获得积分20
5秒前
5秒前
5秒前
兴奋冬萱发布了新的文献求助10
6秒前
我是老大应助Grinde采纳,获得10
6秒前
肖xy发布了新的文献求助10
7秒前
inspirx完成签到,获得积分10
7秒前
ru完成签到,获得积分10
8秒前
8秒前
宋子琛完成签到,获得积分10
8秒前
jja881完成签到,获得积分10
8秒前
hhhhhhhh发布了新的文献求助10
8秒前
稿它完成签到,获得积分10
9秒前
9秒前
余香发布了新的文献求助10
11秒前
小香猪完成签到,获得积分10
12秒前
明理雨莲发布了新的文献求助20
12秒前
12秒前
顺利语蝶关注了科研通微信公众号
12秒前
东方归尘发布了新的文献求助10
13秒前
tt完成签到,获得积分10
13秒前
xxw发布了新的文献求助10
13秒前
13秒前
vv发布了新的文献求助10
14秒前
xhuryts发布了新的文献求助10
14秒前
15秒前
16秒前
!!发布了新的文献求助10
17秒前
Wguan完成签到,获得积分10
17秒前
杨榆藤完成签到,获得积分10
17秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Emmy Noether's Wonderful Theorem 1200
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
基于非线性光纤环形镜的全保偏锁模激光器研究-上海科技大学 800
Signals, Systems, and Signal Processing 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6411983
求助须知:如何正确求助?哪些是违规求助? 8231111
关于积分的说明 17469182
捐赠科研通 5464727
什么是DOI,文献DOI怎么找? 2887374
邀请新用户注册赠送积分活动 1864212
关于科研通互助平台的介绍 1702913