Invention Publication
- Patent Title: 一种基于关键词特征嵌入语言模型的意图识别方法及系统
-
Application No.: CN201911309397.1Application Date: 2019-12-18
-
Publication No.: CN112989839APublication Date: 2021-06-18
- Inventor: 颜永红 , 林格平 , 付瑞柳 , 万辛 , 张学君 , 孙旭东 , 孙晓晨
- Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
- Applicant Address: 北京市海淀区北四环西路21号;
- Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- Current Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- Current Assignee Address: 北京市海淀区北四环西路21号;
- Agency: 北京方安思达知识产权代理有限公司
- Agent 陈琳琳; 杨青
- Main IPC: G06F40/30
- IPC: G06F40/30 ; G06F40/284

Abstract:
本发明属于自然语言处理技术领域,具体涉及一种基于关键词特征嵌入语言模型的意图识别方法,包括:采用前后向最大分词算法,对提取的有效文本的语言信息进行分词,获得不同类别的分词结果;针对获得的不同类别的分词结果,获得不同类别的分词结果对应的候选意图相关的关键词列表;剔除每一种类别的分词结果对应的候选意图相关的关键词列表中的通用高频词和领域无关词,获得每一种类别的分词结果对应的最终关键词表,进而获得不同的关键词特征向量;将获得的每一个关键词特征向量嵌入至预先训练好的语言模型,获得带有关键词特征的有效文本的语音信息;并对其进行编码和分类,获得该有效文本的语言信息的意图识别结果。
Information query