-
公开(公告)号:CN116205230A
公开(公告)日:2023-06-02
申请号:CN202211712884.4
申请日:2022-12-26
申请人: 讯飞医疗科技股份有限公司
IPC分类号: G06F40/295 , G06F16/33 , G06F16/35 , G06N3/0455 , G06N3/048 , G06N3/08
摘要: 本申请提出一种实体识别方法、装置、电子设备及存储介质,方法包括:将待识别文本输入到预先训练的实体识别模型中,得到待识别文本对应的实体标签;其中,实体识别模型至少通过将预先构建的实体识别规则嵌入与实体识别规则相匹配的第一训练样本,并利用嵌入实体识别规则后的第一训练样本进行实体识别训练得到,与实体识别规则相匹配的第一训练样本,包括能够通过实体识别规则识别样本中的实体的文本样本。采用本方案,将预先构建的实体识别规则融入到实体识别模型中,实体识别规则可以在样本较少时,也能得到较高的识别效果,因此,融入了实体识别规则的实体识别模型,能够提高实体识别模型的准确率,从而提高医疗文本的命名实体识别的准确率。