发明公开
- 专利标题: 一种基于知识图谱的中医诊疗模型数据扩充系统及方法
-
申请号: CN202410292345.2申请日: 2024-03-14
-
公开(公告)号: CN118262874A公开(公告)日: 2024-06-28
- 发明人: 朱军龙 , 覃洪伦 , 王琳 , 张明川 , 吴庆涛 , 赵旭辉 , 李美雯
- 申请人: 河南科技大学
- 申请人地址: 河南省洛阳市涧西区西苑路48号
- 专利权人: 河南科技大学
- 当前专利权人: 河南科技大学
- 当前专利权人地址: 河南省洛阳市涧西区西苑路48号
- 代理机构: 洛阳公信知识产权事务所
- 代理商 王陶琼
- 主分类号: G16H20/90
- IPC分类号: G16H20/90 ; G16H50/70 ; G06F16/33 ; G06F16/36 ; G06F40/194 ; G06F40/242 ; G06F40/289 ; G06F40/30 ; G06N5/022
摘要:
本发明涉及一种基于知识图谱的中医模型数据扩充系统及方法,扩充系统包括知识图谱生成模块、语料生成模块和数据标准化模块,知识图谱生成模块用于对中医数据进行实体识别和关系抽取,通过三元组进行知识表示、实体对齐和质量评估,生成知识图谱;语料生成模块用于将知识图谱转化成中医文本,并对生成的中医文本进行数据增强;数据标准化模块用于将中医文本中存在的文言文数据转化为白话文,并对中医文本进行筛选、去重、去隐私化处理,通过知识图谱生成模块构建基于中医医疗领域的知识图谱,实现中医知识关联和知识融合,然后面向知识图谱进行数据增强,通过合成语料库生成来扩充中医语料库,最后对中医语料进行去重、去隐私化等标准化处理。