发明公开
- 专利标题: 一种实体识别方法、装置、设备及存储介质
-
申请号: CN202110230354.5申请日: 2021-03-02
-
公开(公告)号: CN112926327A公开(公告)日: 2021-06-08
- 发明人: 王旭仁 , 熊子晗 , 刘润时 , 何松恒 , 姜政伟 , 施智平 , 江钧 , 凌志婷 , 李小萌 , 刘宝旭 , 熊梦博 , 朱新帅 , 张小庆 , 陈蓉
- 申请人: 首都师范大学 , 中国科学院信息工程研究所
- 申请人地址: 北京市海淀区西三环北路105号;
- 专利权人: 首都师范大学,中国科学院信息工程研究所
- 当前专利权人: 首都师范大学,中国科学院信息工程研究所
- 当前专利权人地址: 北京市海淀区西三环北路105号;
- 代理机构: 北京超凡宏宇专利代理事务所
- 代理商 荣颖佳
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本申请提供了一种实体识别方法、装置、设备及存储介质,该方法包括:获取原始威胁情报文本;针对每一原始威胁情报文本,按照分词所属实体的实体类型,对该原始威胁情报文本中的每一个分词进行标记,得到训练样本;将训练样本输入实体识别模型,利用该训练样本中的每一个分词以及该分词对应的所述实体标记,对该实体识别模型进行训练,得到训练好的实体识别模型,其中,实体识别模型在训练过程中使用的损失函数用于减小所属实体标记相同的分词之间的空间距离以及增大所属实体标记不同的分词之间的空间距离;将待识别的威胁情报文本输入训练好的实体识别模型中,得到实体识别结果。可以提高对威胁情报领域内特定类型实体的识别准确度。
公开/授权文献
- CN112926327B 一种实体识别方法、装置、设备及存储介质 公开/授权日:2022-05-20