- 专利标题: 基于自然语言处理的数据治理系统、方法、设备及介质
-
申请号: CN202410726835.9申请日: 2024-06-06
-
公开(公告)号: CN118297069B公开(公告)日: 2024-08-30
- 发明人: 金剑 , 王萌 , 李凤荣 , 林文丛 , 李振刚 , 孙志强
- 申请人: 北方健康医疗大数据科技有限公司
- 申请人地址: 山东省济南市槐荫区恒大雅苑8-1地块商务办公B座24层
- 专利权人: 北方健康医疗大数据科技有限公司
- 当前专利权人: 北方健康医疗大数据科技有限公司
- 当前专利权人地址: 山东省济南市槐荫区恒大雅苑8-1地块商务办公B座24层
- 代理机构: 济南舜源专利事务所有限公司
- 代理商 孙玉营
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/284 ; G06F18/22 ; G16H50/70
摘要:
本申请公开了一种基于自然语言处理的数据治理系统、方法、设备及介质,主要涉及医疗数据治理技术领域,用以解决现有方案数据读取能力低、NLP方案在处理医疗文本时容易产生误识别,导致提取的信息不准确的问题。包括:获得词性识别类数据对应的训练好的第一自然语言处理模型;获得实体相似度计算类数据对应的训练好的第二自然语言处理模型;获得医学统一编码类数据对应的训练好的第三自然语言处理模型;获得变量提取类数据对应的训练好的第四自然语言处理模型;当读取到原始医疗数据后,获得对应的分词数据集;获得词性识别类数据、实体相似度计算类数据、医学统一编码类数据和变量提取类数据各自对应的具体结果。
公开/授权文献
- CN118297069A 基于自然语言处理的数据治理系统、方法、设备及介质 公开/授权日:2024-07-05