专利检索 ap:("中移在线服务有限公司" OR "中国科学院声学研究所") AND inv:"李昭奇" 第 1 页

1.

发明公开
语音关键词识别方法和装置审中-实审

公开(公告)号：CN111798840A

公开(公告)日：2020-10-20

申请号：CN202010688457.1

申请日：2020-07-16

申请人： 中移在线服务有限公司 , 中国科学院声学研究所

发明人： 赵江江 , 李昭奇 , 任玉玲 , 李青龙 , 黎塔 , 颜永红

IPC分类号： G10L15/08 , G10L15/14 , G10L15/02 , G10L25/24 , G10L25/30 , G10L25/45

摘要： 本申请提供一种语音关键词识别方法和装置，从目标关键词的音频中提取出第一声学特征和第二声学特征，将第一声学特征和第二声学特征拼接为第一声学特征序列；从待识别的目标语音的音频中提取出第三声学特征和第四声学特征，将第三声学特征和第四声学特征拼接为第二声学特征序列；将第一、第二声学特征序列分别输入预先训练的第一模型和第二模型，输出第一、第二嵌入向量；计算第一嵌入向量与第二嵌入式向量之间的相似度，基于相似度确定目标语音中是否包含目标关键词。该方法使得输出的嵌入向量包含更多的上下文信息，改善了样例关键词识别的有效性。

2.

发明授权
语音关键词识别方法和装置有权

公开(公告)号：CN111798840B

公开(公告)日：2023-08-08

申请号：CN202010688457.1

申请日：2020-07-16

申请人： 中移在线服务有限公司 , 中国科学院声学研究所

发明人： 赵江江 , 李昭奇 , 任玉玲 , 李青龙 , 黎塔 , 颜永红

IPC分类号： G10L15/08 , G10L15/14 , G10L15/02 , G10L25/24 , G10L25/30 , G10L25/45

摘要： 本申请提供一种语音关键词识别方法和装置，从目标关键词的音频中提取出第一声学特征和第二声学特征，将第一声学特征和第二声学特征拼接为第一声学特征序列；从待识别的目标语音的音频中提取出第三声学特征和第四声学特征，将第三声学特征和第四声学特征拼接为第二声学特征序列；将第一、第二声学特征序列分别输入预先训练的第一模型和第二模型，输出第一、第二嵌入向量；计算第一嵌入向量与第二嵌入式向量之间的相似度，基于相似度确定目标语音中是否包含目标关键词。该方法使得输出的嵌入向量包含更多的上下文信息，改善了样例关键词识别的有效性。