The implications of handwritten text recognition for accessing the past at scale

计算机科学 独创性 元数据 蓝图 数据科学 叙述的 奖学金 抄写(语言学) 人工智能 万维网 社会学 政治学 定性研究 机械工程 社会科学 语言学 哲学 法学 工程类
作者
Joseph Nockels,Paul Gooding,Melissa Terras
出处
期刊:Journal of Documentation [Emerald Publishing Limited]
卷期号:80 (7): 148-167 被引量:1
标识
DOI:10.1108/jd-09-2023-0183
摘要

Purpose This paper focuses on image-to-text manuscript processing through Handwritten Text Recognition (HTR), a Machine Learning (ML) approach enabled by Artificial Intelligence (AI). With HTR now achieving high levels of accuracy, we consider its potential impact on our near-future information environment and knowledge of the past. Design/methodology/approach In undertaking a more constructivist analysis, we identified gaps in the current literature through a Grounded Theory Method (GTM). This guided an iterative process of concept mapping through writing sprints in workshop settings. We identified, explored and confirmed themes through group discussion and a further interrogation of relevant literature, until reaching saturation. Findings Catalogued as part of our GTM, 120 published texts underpin this paper. We found that HTR facilitates accurate transcription and dataset cleaning, while facilitating access to a variety of historical material. HTR contributes to a virtuous cycle of dataset production and can inform the development of online cataloguing. However, current limitations include dependency on digitisation pipelines, potential archival history omission and entrenchment of bias. We also cite near-future HTR considerations. These include encouraging open access, integrating advanced AI processes and metadata extraction; legal and moral issues surrounding copyright and data ethics; crediting individuals’ transcription contributions and HTR’s environmental costs. Originality/value Our research produces a set of best practice recommendations for researchers, data providers and memory institutions, surrounding HTR use. This forms an initial, though not comprehensive, blueprint for directing future HTR research. In pursuing this, the narrative that HTR’s speed and efficiency will simply transform scholarship in archives is deconstructed.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
yn完成签到 ,获得积分10
2秒前
3秒前
结实的青荷完成签到,获得积分10
3秒前
H_dd发布了新的文献求助10
5秒前
maclogos发布了新的文献求助10
5秒前
leeSongha完成签到 ,获得积分10
6秒前
仁爱钢笔完成签到 ,获得积分10
6秒前
7秒前
Akim应助钠钾蹦采纳,获得10
8秒前
小田发布了新的文献求助30
9秒前
疯狂的依波完成签到,获得积分10
11秒前
13秒前
艾瑞克完成签到,获得积分10
16秒前
19秒前
小小鱼完成签到,获得积分10
21秒前
李爱国应助maclogos采纳,获得10
21秒前
zzZ5完成签到,获得积分10
22秒前
23秒前
zzZ5发布了新的文献求助10
24秒前
24秒前
27秒前
meixinhu发布了新的文献求助10
28秒前
28秒前
28秒前
fff完成签到 ,获得积分10
29秒前
叉叉茶完成签到 ,获得积分10
29秒前
钠钾蹦发布了新的文献求助10
29秒前
qiao应助zhangzheng采纳,获得10
30秒前
是是是WQ完成签到 ,获得积分0
32秒前
xwtx发布了新的文献求助10
32秒前
fanzi完成签到 ,获得积分10
35秒前
今后应助lemon 1118采纳,获得10
37秒前
lucky完成签到 ,获得积分10
38秒前
YCH发布了新的文献求助10
40秒前
HuSP完成签到,获得积分10
40秒前
Orange应助香菜皮蛋采纳,获得10
41秒前
Hehe完成签到,获得积分10
42秒前
22发布了新的文献求助10
43秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779743
求助须知:如何正确求助?哪些是违规求助? 3325186
关于积分的说明 10221815
捐赠科研通 3040328
什么是DOI,文献DOI怎么找? 1668715
邀请新用户注册赠送积分活动 798775
科研通“疑难数据库(出版商)”最低求助积分说明 758535