一种融合实体间关系的中文医学命名实体识别方法和装置

    公开(公告)号:CN114817459B

    公开(公告)日:2025-04-01

    申请号:CN202210323152.X

    申请日:2022-03-29

    Abstract: 本发明公开了一种融合实体间关系的中文医学命名实体识别方法和装置,其中,该方法包括:通过预训练的编码模型对医学文本进行编码处理,并利用编码网络进行编码处理获得高层级特征向量;利用预训练的编码模型进行关系嵌入表示,同时采用注意力机制将第二文本信息作为上下文信息,并对医学文本中的关系嵌入和文本嵌入进行运算得到医学文本的关系特征信息;通过权重分配策略计算概率权重并融合上下文信息和关系特征信息,以对关系特征信息和医学文本进行权重分配平衡;通过实体识别模型的解码输出概率最高的命名实体类别,以得到对应医学文本的各标签结果。本发明可以将关系信息有效融入文本表示中,以增强医学领域实体识别能力。

    多人协作图像标注质量控制的方法和装置

    公开(公告)号:CN110991486A

    公开(公告)日:2020-04-10

    申请号:CN201911082512.6

    申请日:2019-11-07

    Abstract: 本发明公开了一种多人协作图像标注质量控制的方法和装置,其中,方法包括:在标注包中按预设的比例投入金标准数据,以验证标注用户针对任一标注包的标注质量,通过验证的标注包数据暂定为合格,执行下一步骤,未通过的数据包将被重新打散,重新分配给用户进行标注;将一份图像分发给多位用户,收集多位用户对图像的标注结果,获取重复标签后,得到真实标签;以数据包或者用户为单位进行随机抽检,评价标注质量;将使用金标准推算的用户准确率反馈给用户,并将金标准中以及人工抽检出的错误数据及其对应的正确答案反馈给标注用户,以使标注用户接收再训练。该方法不仅可以保证标注质量,而且可以获取正确标注结果,简单易实现。

    一种融合实体间关系的中文医学命名实体识别方法和装置

    公开(公告)号:CN114817459A

    公开(公告)日:2022-07-29

    申请号:CN202210323152.X

    申请日:2022-03-29

    Abstract: 本发明公开了一种融合实体间关系的中文医学命名实体识别方法和装置,其中,该方法包括:通过预训练的编码模型对医学文本进行编码处理,并利用编码网络进行编码处理获得高层级特征向量;利用预训练的编码模型进行关系嵌入表示,同时采用注意力机制将第二文本信息作为上下文信息,并对医学文本中的关系嵌入和文本嵌入进行运算得到医学文本的关系特征信息;通过权重分配策略计算概率权重并融合上下文信息和关系特征信息,以对关系特征信息和医学文本进行权重分配平衡;通过实体识别模型的解码输出概率最高的命名实体类别,以得到对应医学文本的各标签结果。本发明可以将关系信息有效融入文本表示中,以增强医学领域实体识别能力。

    一种医学命名实体识别方法及系统

    公开(公告)号:CN114239580A

    公开(公告)日:2022-03-25

    申请号:CN202111333648.7

    申请日:2021-11-11

    Abstract: 本发明涉及一种医学命名实体识别方法及系统,所述方法包括:获取待进行医学命名实体的目标文本及所述目标文本中各实体对应的百科知识文本;将所述待进行医学命名实体的目标文本及所述目标文本中各实体对应的百科知识文本输入预先训练好的医学命名实体识别模型中,得到所述目标文本的医学命名实体识别结果;其中,所述预先训练的医学命名实体识别模型是基于预先标记好实体的文本获取的;所述预先训练的医学命名实体识别模型包括:BERT层、Bi‑LSTM层、知识层和CRF层。本发明提供的技术方案,基于对文本中各实体对应的百科知识信息查询,考虑百科知识与文本的关系,利用百科知识增强原文本表示,然后再进行目标文本的医学命名实体识别,进而增强了命名实体的识别效果。

Patent Agency Ranking