- 专利标题: 一种维吾尔语实体识别的方法、装置和电子设备
-
申请号: CN202010840349.1申请日: 2020-08-20
-
公开(公告)号: CN111814433A公开(公告)日: 2020-10-23
- 发明人: 钱泓锦 , 刘占亮 , 窦志成 , 刘家俊
- 申请人: 北京智源人工智能研究院
- 申请人地址: 北京市海淀区中关村南大街1号北京友谊宾馆苏园东北角楼及后院66012-3层61342房间
- 专利权人: 北京智源人工智能研究院
- 当前专利权人: 北京智源人工智能研究院
- 当前专利权人地址: 北京市海淀区中关村南大街1号北京友谊宾馆苏园东北角楼及后院66012-3层61342房间
- 代理机构: 北京动力号知识产权代理有限公司
- 代理商 梁艳
- 主分类号: G06F40/126
- IPC分类号: G06F40/126 ; G06F40/16 ; G06F40/295 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种维吾尔语实体识别的方法、装置和电子设备。方法包括:将待识别的维吾尔语语句中的字符转换为拉丁字母,得到待识别的维吾尔语语句的拉丁字母表示形式;将拉丁字母表示形式输入到预先训练的字符级语言模型中,提取所述待识别的维吾尔语语句的语义特征;将所述语义特征输入到预先训练的实体识别模型中,得到所述待识别的维吾尔语语句的初步实体识别结果;从所述初步实体识别结果中提取实体词;对所述实体词进行去词缀处理,得到最终实体识别结果。本发明能够有效避免维吾尔字符变形带来的语义特征提取的复杂度,完全解决了维吾尔语词级别语言模型的缺陷。
公开/授权文献
- CN111814433B 一种维吾尔语实体识别的方法、装置和电子设备 公开/授权日:2022-02-18