发明公开
- 专利标题: 基于词汇增强和深度学习的中文命名实体识别方法及系统
-
申请号: CN202310054386.3申请日: 2023-02-03
-
公开(公告)号: CN116011455A公开(公告)日: 2023-04-25
- 发明人: 陈剑洪 , 刘津铭 , 陈天赐 , 王洪亚 , 陈礼青 , 魏太林
- 申请人: 淮阴工学院
- 申请人地址: 江苏省淮安市经济技术开发区枚乘东路1号
- 专利权人: 淮阴工学院
- 当前专利权人: 淮阴工学院
- 当前专利权人地址: 江苏省淮安市经济技术开发区枚乘东路1号
- 代理机构: 南京苏高专利商标事务所
- 代理商 张弛
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/242 ; G06N3/0442 ; G06N3/084
摘要:
本发明公开了一种基于词汇增强和深度学习的中文命名实体识别方法及系统,通过结合词典信息的输入序列匹配方法以及基于统计的静态加权方法进行中文文本序列的输入向量表示,使用基于双向长短时记忆网络和多头注意力机制结合的序列建模方法,使用条件随机场针对实体标签之间的相互依赖关系进行实体标签预测,使得完全保留先验词典中的词汇信息,在实现词汇增强的同时解决了传递过程中的词汇信息损失问题,提高识别精准度。