Traditional Chinese Medicine Formula Classification Using Large Language Models

集合(抽象数据类型) 标准化 任务(项目管理) 计算机科学 编码(社会科学) 中医药 自然语言处理 数据挖掘 人工智能 医学 统计 数学 替代医学 工程类 病理 系统工程 程序设计语言 操作系统
作者
Zhe Wang,Keqian Li,Quanying Ren,Keyu Yao,Yan Zhu
标识
DOI:10.1109/bibm58861.2023.10385776
摘要

Objective: In this study, we aim to investigate the utilization of large language models (LLMs) for traditional Chinese medicine (TCM) formula classification by fine-tuning the LLMs and prompt template. Methods: We refined and cleaned the data from the Coding Rules for Chinese Medicinal Formulas and Their Codes [1], the Chinese National Medical Insurance Catalog for Proprietary Chinese Medicines [2], and Textbooks of Formulas of Chinese Medicine [3] to address the standardization of TCM formula information, and finally we extracted 2308 TCM formula data as a dataset in this study. We designed a prompt template for the TCM formula classification task and randomly divided the formula dataset into three subsets: a training set (2000 formulas), a test set (208 formulas), and a validation set (100 formulas). We fine-tuned the open-source LLMs such as ChatGLM-6b and ChatGLM2-6b. Finally, we evaluate all selected LLMs in our study: ChatGLM-6b (original), ChatGLM2-6b (original), ChatGLM-130b, InternLM-20b, ChatGPT, ChatGLM-6b (fine-tuned), and ChatGLM2-6b (fine-tuned). Results: The results showed that ChatGLM2-6b (fine-tuned) and ChatGLM-6b (fine-tuned) achieved the highest accuracy rates of 71% and 70% on the validation set, respectively. The accuracy rates of other models were ChatGLM-130b 58%, ChatGPT 53%, InternLM-20b 52%, ChatGLM2-6b (original) 41%, and ChatGLM-6b (original) 23%. Conclusion: LLMs achieved an impressive 71% accuracy in the formula classification task in our study. This was achieved through fine-tuning and the utilization of prompt templates. And provided a novel option for the utilization of LLMs in the field of TCM.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
大头完成签到 ,获得积分10
4秒前
嘟噜完成签到 ,获得积分10
7秒前
顾矜应助危机的幻梦采纳,获得10
10秒前
占那个完成签到 ,获得积分10
21秒前
23秒前
番茄炒蛋完成签到,获得积分10
25秒前
微雨若,,完成签到 ,获得积分10
27秒前
周小鱼完成签到,获得积分10
30秒前
岂有此李完成签到,获得积分10
32秒前
duonicola完成签到,获得积分10
32秒前
昏睡的蟠桃发布了新的文献求助200
33秒前
程程完成签到,获得积分10
34秒前
祁乾完成签到 ,获得积分10
36秒前
一修完成签到,获得积分10
45秒前
欧皇完成签到,获得积分20
51秒前
52秒前
李家静完成签到 ,获得积分10
56秒前
58秒前
周周粥完成签到 ,获得积分10
58秒前
韦老虎完成签到,获得积分10
1分钟前
安澜完成签到,获得积分10
1分钟前
春天的粥完成签到 ,获得积分10
1分钟前
zero完成签到 ,获得积分10
1分钟前
集典完成签到 ,获得积分10
1分钟前
1分钟前
liciky完成签到 ,获得积分10
1分钟前
难过唯雪完成签到 ,获得积分10
1分钟前
Shoujiang完成签到 ,获得积分10
1分钟前
1分钟前
faye完成签到,获得积分10
1分钟前
Thunnus001完成签到 ,获得积分10
1分钟前
1分钟前
住在魔仙堡的鱼完成签到 ,获得积分10
1分钟前
称心的新之完成签到,获得积分10
1分钟前
踏实谷蓝完成签到 ,获得积分10
1分钟前
无敌幸运儿完成签到 ,获得积分10
1分钟前
清秀的怀蕊完成签到 ,获得积分0
1分钟前
尊敬枕头完成签到 ,获得积分10
1分钟前
一枝完成签到 ,获得积分10
1分钟前
高分求助中
传播真理奋斗不息——中共中央编译局成立50周年纪念文集(1953—2003) 700
Technologies supporting mass customization of apparel: A pilot project 600
武汉作战 石川达三 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3811753
求助须知:如何正确求助?哪些是违规求助? 3356021
关于积分的说明 10379166
捐赠科研通 3072972
什么是DOI,文献DOI怎么找? 1688168
邀请新用户注册赠送积分活动 811860
科研通“疑难数据库(出版商)”最低求助积分说明 766893