一种基于深度学习的实体关系抽取方法及系统

    公开(公告)号:CN116796744A

    公开(公告)日:2023-09-22

    申请号:CN202310501251.7

    申请日:2023-05-05

    摘要: 本发明公开了一种基于深度学习的实体关系抽取方法及系统,所述实体关系抽取方法包括:S1:构建领域词库步骤,基于规则挖掘、中文命名实体识别工具及知识图谱检索构建领域词库;S2:实体识别模型构建步骤,构建的实体识别模型基于字词联合嵌入的表示方法,通过双向长短时记忆神经网络和条件随机场进行实体识别;S3:领域知识库构建步骤,所述领域知识库被配置为包括维基百科、各知识图谱以及基于依存句法分析设计的6种抽取范式;S4:构建关系抽取模型步骤,基于PCNN的实体关系抽取模型面向预设领域的实体关系抽取,得到文本特征语义表示。

    命名实体名称标准化的方法和装置、电子设备和存储介质

    公开(公告)号:CN116127979B

    公开(公告)日:2023-09-19

    申请号:CN202310347505.4

    申请日:2023-04-04

    摘要: 本申请公开了一种命名实体名称标准化的方法和装置、电子设备和存储介质,该方法包括基于命名实体原词从标准词库中召回初始命名实体标准词,其中,初始命名实体标准词具有与命名实体原词的第一相似度;预测与命名实体原词对应标准词的预测数量,其中,预测数量小于等于召回的初始命名实体标准词数量;基于第一相似度,从召回的初始命名实体标准词中确定预测数量的命名实体标准词。如此,提高了命名实体名称标准化的准确率。

    确定医嘱成本的方法、装置、介质及电子设备

    公开(公告)号:CN116757759A

    公开(公告)日:2023-09-15

    申请号:CN202310679735.0

    申请日:2023-06-08

    摘要: 本公开涉及一种确定医嘱成本的方法、装置、介质及电子设备,方法包括:获取医嘱的医嘱信息;根据所述医嘱信息,确定执行所述医嘱的目标作业链;根据预设的成本字典和所述目标作业链中执行所述医嘱的目标执行动作,确定对应所述医嘱的成本,其中,所述成本字典中包括每个执行动作和与每个执行动作对应的成本;根据所有所述医嘱的成本,确定第一目标维度对应的总成本。基于医嘱的医嘱信息,将医嘱向下分解为粒度更低的执行动作,以执行医嘱所需要的执行动作的成本来确定医嘱的成本,在此基础上,再向上根据表征用户需求的第一目标维度,来确定第一目标维度对应的总成本,解决了医嘱成本的核算不准确的问题。

    基于多语言词条的文本翻译方法及系统

    公开(公告)号:CN116522966B

    公开(公告)日:2023-09-15

    申请号:CN202310790221.2

    申请日:2023-06-30

    摘要: 本发明涉及数据处理领域,公开了一种基于多语言词条的文本翻译方法及系统,用于提高对多语言词条进行文本翻译时的效率以及准确率。方法包括:获取多语言文档,并对多语言文档进行字符串提取,得到目标字符串;对目标字符串进行字符串分割处理,得到多个词条并进行数据提取,得到每个词条的键值以及每个词条的内容值并进行键值对匹配,得到多组键值对;对每组键值对进行数值匹配分析,得到数值匹配分析结果并对多组键值对进行修正处理,得到多组目标键值对;对多组目标键值对进行字符串生成,得到多个目标键值字符串,将多个目标键值字符串进行格式转换,得到待翻译文档;通过语言翻译模型对待翻译文档进行文档翻译,得到目标文档。

    核保方法、装置、终端设备以及存储介质

    公开(公告)号:CN116703616A

    公开(公告)日:2023-09-05

    申请号:CN202310725473.7

    申请日:2023-06-16

    发明人: 曾田丰 邹昆伦

    摘要: 本申请涉及金融科技领域,公开了一种核保方法、装置、终端设备及存储介质,该核保方法包括:响应目标对象的投保请求在终端设备的预设界面展示预先配置的健康告知书并输出第一提示信息;当目标对象在健康告知书中所填写的健康信息项目存在异常时,输出第二提示信息;在接收到目标对象响应第二提示信息所上传的健康评定文件之后,识别健康评定文件的文件类型;根据文件类型为健康评定文件匹配对应的文件处理策略,并根据文件处理策略将健康评定文件处理成标准评定文件;提取标准评定文件的文本信息,并根据预设的错词数据库对文本信息进行校验得到校验文本信息,及根据校验文本信息得出投保请求的核保结论。

    一种暴力词汇的分析方法、系统、装置及介质

    公开(公告)号:CN116629250A

    公开(公告)日:2023-08-22

    申请号:CN202310482598.1

    申请日:2023-04-28

    摘要: 本发明公开了一种暴力词汇的分析方法、系统、装置及介质。该方法通过获取待检测的目标词汇;根据更新后的万有引力模型对目标词汇进行效价分析,得到目标词汇的暴力效价值;更新后的万有引力模型通过以下步骤得到:获取目标暴力词汇语料库;根据目标暴力词汇语料库,得到训练暴力词汇集和核心暴力词汇集;获取训练暴力词汇集中,与各个训练暴力词汇对应的训练暴力效价值;根据核心暴力词汇集、训练暴力词汇集、目标暴力词汇语料库和各个训练暴力效价值,得到更新后的万有引力模型。该方法通过构建并利用万有引力模型对暴力词汇进行效价分析,有效提高暴力词汇效价分析的可解释性和针对性,准确度较高。本发明可广泛应用于自然语言处理技术领域。

    音义融合的中文语法序列编辑纠错方法、系统、介质、设备

    公开(公告)号:CN116611427A

    公开(公告)日:2023-08-18

    申请号:CN202310546414.3

    申请日:2023-05-16

    发明人: 付俊英

    摘要: 本发明提供一种音义融合的中文语法序列编辑纠错方法、系统、介质、设备,所述方法包括以下步骤:获取错误文本序列;基于所述错误文本序列训练文本纠错模型;其中,所述文本纠错模型用于获取所述错误文本序列对应的正确文本序列,基于所述正确文本序列获取所述错误文本序列中每个字符的标签信息,基于所述标签信息生成所述错误文本序列的表示矩阵和拼音信息,基于所述表示矩阵和所述拼音信息获取所述正确文本序列;基于训练好的文本纠错模型进行待纠错文本的纠错。本发明的音义融合的中文语法序列编辑纠错方法、系统、介质、设备结合文本的音义信息,采用神经网络模型进行中文语法纠错,有效提升了准确性和实用性。

    翻译模型压缩方法、装置、移动终端及存储介质

    公开(公告)号:CN116596027A

    公开(公告)日:2023-08-15

    申请号:CN202310483186.X

    申请日:2023-04-28

    摘要: 本申请提供翻译模型压缩方法、装置、移动终端及存储介质。方法包括根据训练语料训练教师机器学习模型获取教师翻译模型;根据训练语料训练学生机器学习模型获取学生翻译模型;将训练语料输入教师翻译模型获取第一输出结果;将训练语料输入学生翻译模型获取第二输出结果;获取第一输出结果和第二输出结果的分布距离;根据预先设置的损失函数对第一输出结果、第二输出结果和分布距离进行损失计算获取损失计算结果并对学生翻译模型进行参数调整获取第一翻译模型压缩结果。由于本申请提供的翻译模型压缩方法考虑到第一输出结果和第二输出结果之间的分布距离,避免了学生翻译模型调整过于敏感的问题。

    一种实体链接方法及装置、存储介质、计算机设备

    公开(公告)号:CN116579297A

    公开(公告)日:2023-08-11

    申请号:CN202310460767.1

    申请日:2023-04-23

    发明人: 张倩

    摘要: 本发明公开了一种实体链接方法及装置、存储介质、计算机设备,属于数字医疗技术领域,主要解决现有技术中实体链接的准确度不高的问题,包括:确定输入文本中待链接实体的多个候选实体,所述候选实体绑定有实体描述信息和实体关联关系;对所述输入文本与所述实体描述信息进行文本匹配处理,得两者之间的信息匹配度,并确定所述输入文本与所述实体描述信息之间的上下文相关度;基于所述实体关联关系对所述候选实体的平稳度进行评估,得到所述候选实体的平稳概率值;基于所述信息匹配度、所述平稳概率值和所述上下文相关度确定所述候选实体的链接评估结果,并基于所述链接评估结果将所述待链接实体链接至目标实体名称。