一种基于知识图谱的中医诊疗模型数据扩充系统及方法
摘要:
本发明涉及一种基于知识图谱的中医模型数据扩充系统及方法,扩充系统包括知识图谱生成模块、语料生成模块和数据标准化模块,知识图谱生成模块用于对中医数据进行实体识别和关系抽取,通过三元组进行知识表示、实体对齐和质量评估,生成知识图谱;语料生成模块用于将知识图谱转化成中医文本,并对生成的中医文本进行数据增强;数据标准化模块用于将中医文本中存在的文言文数据转化为白话文,并对中医文本进行筛选、去重、去隐私化处理,通过知识图谱生成模块构建基于中医医疗领域的知识图谱,实现中医知识关联和知识融合,然后面向知识图谱进行数据增强,通过合成语料库生成来扩充中医语料库,最后对中医语料进行去重、去隐私化等标准化处理。
0/0