发明公开
- 专利标题: 语料的处理方法、装置、存储介质及处理器
-
申请号: CN202011507899.8申请日: 2020-12-18
-
公开(公告)号: CN112632985A公开(公告)日: 2021-04-09
- 发明人: 尚颖 , 张晔 , 马薇 , 黄松 , 徐光兵 , 李彦龙 , 梁卫泉 , 丁勇 , 王端瑞 , 侯本忠 , 张永强 , 闫丽飞
- 申请人: 国网北京市电力公司 , 国家电网有限公司 , 福建亿榕信息技术有限公司
- 申请人地址: 北京市西城区前门西大街41号; ;
- 专利权人: 国网北京市电力公司,国家电网有限公司,福建亿榕信息技术有限公司
- 当前专利权人: 国网北京市电力公司,国家电网有限公司,福建亿榕信息技术有限公司
- 当前专利权人地址: 北京市西城区前门西大街41号; ;
- 代理机构: 北京康信知识产权代理有限责任公司
- 代理商 董文倩
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种语料的处理方法、装置、存储介质及处理器。其中,该方法包括:获取待识别的词句;采用新词发现模型处理词句,识别出至少一个候选语料,其中,新词发现模型为采用深度学习模型训练得到的语料模型;从至少一个候选语料中确定目标语料,其中,目标语料为从词句中识别出来的新词汇。本发明解决了现有技术中获取术语过程效率低的技术问题。