Text Representation Model for Multiple Language Forms in Spoken Chinese Expression

拼音 计算机科学 自然语言处理 人工智能 表达式(计算机科学) 口语 语言模型 光学(聚焦) 语言学 汉字 光学 物理 哲学 程序设计语言
作者
Miao Hu,Junjie Peng,Wenqiang Zhang,Jingxiang Hu,Lizhe Qi,Huanxiang Zhang
出处
期刊:International Journal of Pattern Recognition and Artificial Intelligence [World Scientific]
卷期号:36 (08) 被引量:1
标识
DOI:10.1142/s0218001422530044
摘要

Mixture of multiple language forms in spoken Chinese is a common but unfavorable issue.. It increases the difficulty of intent understanding and leads to inconvenience for information communication. Existing studies on intent recognition mainly focus on single language form or parallel multilingual language while paying little attention to spoken texts including multiple language forms. In considering that it is hard to capture the semantics of an expression with multiple language forms, it is important to study the problem. To solve this issue, a text representation model for the spoken Chinese expression mixed with English and Chinese Pinyin is proposed. And the feature matrix is built to mine the composition information of English and Pinyin. Besides, the model can efficiently distinguish English from Chinese Pinyin even though both fragments are composed of English letters. Meanwhile, it can effectively process the problem of hidden text information since the problem has been transformed into the Chinese translation task of English and Pinyin. In addition, to verify the performance of the model, the texts processed by this model are used as the input of the classifier. extensive experiments on a large online logistics manual customer service corpus show that this text representation model is correct and effective. It can not only eliminate the obstacles of the mixing of multiple language forms but also bring better results for intent understanding.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
打工肥仔完成签到,获得积分0
刚刚
gf发布了新的文献求助10
1秒前
lin完成签到,获得积分10
1秒前
3秒前
zzp完成签到,获得积分10
4秒前
谦让的南蕾完成签到,获得积分10
4秒前
4秒前
狂野土豆完成签到 ,获得积分10
4秒前
琳雨完成签到,获得积分10
4秒前
5秒前
包容的紫萍完成签到 ,获得积分10
5秒前
悠然地八音完成签到,获得积分10
6秒前
6秒前
6秒前
雪满头应助HSTrigger采纳,获得10
7秒前
zhaozhao完成签到 ,获得积分10
8秒前
8秒前
liu完成签到,获得积分10
8秒前
研友_5Y9775完成签到,获得积分20
8秒前
躺平行不行给躺平行不行的求助进行了留言
9秒前
搜集达人应助胡俊豪采纳,获得10
9秒前
THEO完成签到,获得积分10
10秒前
10秒前
蜗牛发布了新的文献求助10
10秒前
Alice0210发布了新的文献求助10
10秒前
11秒前
完美世界应助雷L采纳,获得10
12秒前
王哈哈发布了新的文献求助10
13秒前
13秒前
13秒前
豆子发布了新的文献求助10
14秒前
小呆发布了新的文献求助10
15秒前
16秒前
issac发布了新的文献求助10
17秒前
pluto应助gf采纳,获得10
18秒前
哈喝喊完成签到,获得积分10
19秒前
llya完成签到,获得积分10
19秒前
19秒前
酷波er应助胡俊豪采纳,获得10
20秒前
20秒前
高分求助中
论现代体育科学研究的方法学特征 1000
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Petrology and Plate Tectonics 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6915985
求助须知:如何正确求助?哪些是违规求助? 8607196
关于积分的说明 18262441
捐赠科研通 6328312
什么是DOI,文献DOI怎么找? 3068231
关于科研通互助平台的介绍 2096370
邀请新用户注册赠送积分活动 2045608