Research on Computing Word Similarity in Pre-Qin Classics Language Network Oriented to Digital Humanities

雅卡索引 相似性(几何) 计算机科学 熵(时间箭头) 词(群论) 节点(物理) 人工智能 自然语言处理 理论计算机科学 数学 聚类分析 工程类 物理 几何学 结构工程 量子力学 图像(数学)
作者
Haotian Hu,Sanhong Deng,Dongbo Wang
出处
期刊:Knowledge Organization [Ergon-Verlag]
卷期号:50 (7): 457-474
标识
DOI:10.5771/0943-7444-2023-7-457
摘要

At present, there is relatively little research on ancient Chinese texts in the field of digital humanities, and ancient Chinese information processing urgently needs new algorithms. To realize the word similarity calculation of pre-Qin classics, a total of 25 pre-Qin classics were first mapped into a language network. Based on local relative entropy, we proposed an improved weighted network node similarity calculation method (LREW). This method judges the similarity based on the local network characteristics of the nodes, and the degree of the nodes and the weight information of the edges between the nodes are considered. We used the relative entropy to calculate the difference in the amount of information between different nodes. After experimental comparison, compared with the existing LRE and RE algorithms based on relative entropy, the proposed LREW method can achieve the best results in calculating the similarity between words in the pre-Qin classics. Compared with CN, Jaccard, Salton, and CDSim algorithms based on common neighbor nodes, although the accuracy of LREW is low, the comprehensiveness of the similar word recognition is high, which can ensure that potential similar nodes in the network will not be missed.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
在水一方应助于冷松采纳,获得10
刚刚
2秒前
SA完成签到,获得积分10
2秒前
悲凉的碧玉完成签到,获得积分20
2秒前
Woot发布了新的文献求助30
3秒前
4秒前
4秒前
汉堡包应助万有引力采纳,获得10
4秒前
Str0n发布了新的文献求助10
4秒前
4秒前
杜宇发布了新的文献求助10
4秒前
善学以致用应助不想晚睡采纳,获得10
5秒前
wisper发布了新的文献求助10
5秒前
6秒前
6秒前
6秒前
独角大盗发布了新的文献求助200
6秒前
6秒前
7秒前
好吧不是发布了新的文献求助10
7秒前
量子星尘发布了新的文献求助150
7秒前
乐观的水儿完成签到,获得积分10
7秒前
十月上发布了新的文献求助10
7秒前
hiha完成签到,获得积分10
7秒前
7秒前
董凡侨完成签到,获得积分10
8秒前
窝恁叠完成签到,获得积分20
8秒前
zhh完成签到,获得积分20
9秒前
Auh关闭了Auh文献求助
9秒前
9秒前
baobao完成签到,获得积分10
10秒前
我去打球发布了新的文献求助10
10秒前
轩辕远航发布了新的文献求助10
10秒前
LiShin完成签到 ,获得积分10
10秒前
窝恁叠发布了新的文献求助10
11秒前
wisper完成签到,获得积分10
11秒前
11秒前
betyby发布了新的文献求助10
11秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Nuclear Fuel Behaviour under RIA Conditions 500
Sociologies et cosmopolitisme méthodologique 400
Why America Can't Retrench (And How it Might) 400
Another look at Archaeopteryx as the oldest bird 390
Higher taxa of Basidiomycetes 300
Partial Least Squares Structural Equation Modeling (PLS-SEM) using SmartPLS 3.0 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 催化作用 遗传学 冶金 电极 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 4665285
求助须知:如何正确求助?哪些是违规求助? 4046457
关于积分的说明 12515896
捐赠科研通 3738986
什么是DOI,文献DOI怎么找? 2064970
邀请新用户注册赠送积分活动 1094476
科研通“疑难数据库(出版商)”最低求助积分说明 974883