Joint optimization for attention-based generation and recognition of chinese characters using tree position embedding

接头(建筑物) 嵌入 模式识别(心理学) 人工智能 发电机(电路理论) 树(集合论) 计算机科学 编码器 任务(项目管理) 性格(数学) 对偶(语法数字) 汉字 树形结构 机器学习 数学 工程类 算法 操作系统 二叉树 量子力学 文学类 管理 几何学 物理 功率(物理) 数学分析 艺术 建筑工程 经济
作者
Mobai Xue,Jun Du,Bin Wang,Bo Ren,Hao Yu
出处
期刊:Pattern Recognition [Elsevier]
卷期号:140: 109538-109538 被引量:1
标识
DOI:10.1016/j.patcog.2023.109538
摘要

Despite the growing interest in Chinese character generation, creating a nonexistent character remains an open challenge. Radical-based Chinese character generation is still a novel task while radical-based Chinese character recognition is more technologically advanced. To fully utilize the knowledge of recognition task, we first propose an attention-based generator. The generator chooses the most relevant radical to generate each zone with an attention mechanism. Then, we present a joint optimization approach to training generation-recognition models, which can help the generator and recognizer learn from each other effectively. The joint optimization is implemented via contrastive learning and dual learning. Considering the symmetry of the generation and recognition, contrastive learning aims to strengthen the performance of the encoder of recognizer and the decoder of generator. Since the generation and recognition tasks can form a closed loop, dual learning feeds the output from one to another as input. Based on the feedback signals generated during the two tasks, we can iteratively update the two models until convergence. Finally, as our model ignores the order information of a sequence, we exploit position embedding to extend the image representation ability and propose tree position embedding to represent the positional information for tree structure captions of Chinese characters. The experimental results in printed and nature scenes show that the proposed method improves the quality of the generating images and increases the recognition accuracy for Chinese characters.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
IAMXC发布了新的文献求助10
4秒前
武夷山关注了科研通微信公众号
5秒前
99giddens发布了新的文献求助30
6秒前
8秒前
小蘑菇应助瘦瘦的念芹采纳,获得10
10秒前
14秒前
fffff完成签到,获得积分10
15秒前
李天惠完成签到 ,获得积分10
17秒前
dudaduda发布了新的文献求助10
19秒前
大气的火龙果完成签到 ,获得积分10
20秒前
20秒前
21秒前
22秒前
谦让面包完成签到,获得积分10
26秒前
武夷山发布了新的文献求助10
26秒前
互助遵法尚德应助白蓝采纳,获得10
30秒前
可可发布了新的文献求助10
31秒前
boss发布了新的文献求助10
35秒前
互助遵法尚德应助杨乃彬采纳,获得10
35秒前
鱼叔完成签到 ,获得积分10
38秒前
追惜完成签到,获得积分10
38秒前
追惜发布了新的文献求助10
41秒前
41秒前
lkk完成签到,获得积分10
42秒前
43秒前
45秒前
Bin发布了新的文献求助10
47秒前
斯文败类应助lpp32采纳,获得10
49秒前
李治发布了新的文献求助10
50秒前
54秒前
SGOM发布了新的文献求助10
55秒前
ding应助鹿飞松采纳,获得10
55秒前
cctv18应助SGOM采纳,获得10
1分钟前
共享精神应助mengwuhen采纳,获得10
1分钟前
Qqh关注了科研通微信公众号
1分钟前
伯赏烨磊发布了新的文献求助10
1分钟前
1分钟前
彭于晏应助天天开心采纳,获得10
1分钟前
1分钟前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 800
Recherches Ethnographiques sue les Yao dans la Chine du Sud 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 500
Chinese-English Translation Lexicon Version 3.0 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 440
Wisdom, Gods and Literature Studies in Assyriology in Honour of W. G. Lambert 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2390106
求助须知:如何正确求助?哪些是违规求助? 2096227
关于积分的说明 5280391
捐赠科研通 1823482
什么是DOI,文献DOI怎么找? 909528
版权声明 559638
科研通“疑难数据库(出版商)”最低求助积分说明 486017