基于自然语言处理的数据治理系统、方法、设备及介质
摘要:
本申请公开了一种基于自然语言处理的数据治理系统、方法、设备及介质,主要涉及医疗数据治理技术领域,用以解决现有方案数据读取能力低、NLP方案在处理医疗文本时容易产生误识别,导致提取的信息不准确的问题。包括:获得词性识别类数据对应的训练好的第一自然语言处理模型;获得实体相似度计算类数据对应的训练好的第二自然语言处理模型;获得医学统一编码类数据对应的训练好的第三自然语言处理模型;获得变量提取类数据对应的训练好的第四自然语言处理模型;当读取到原始医疗数据后,获得对应的分词数据集;获得词性识别类数据、实体相似度计算类数据、医学统一编码类数据和变量提取类数据各自对应的具体结果。
0/0