基于语言模型的语言识别方法、文本分类方法和装置

发明授权

CN111554268B 基于语言模型的语言识别方法、文本分类方法和装置有权

请登陆查看更多内容

专利标题： 基于语言模型的语言识别方法、文本分类方法和装置
申请号： CN202010667400.3

申请日： 2020-07-13
公开(公告)号： CN111554268B

公开(公告)日： 2020-11-03
发明人: 黄展鹏 , 赵博 , 赵瑞辉 , 陆扩建
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构： 广州华进联合专利商标代理有限公司
代理商 毛丹
主分类号： G10L15/00
IPC分类号： G10L15/00 ; G10L15/06 ; G10L15/18 ; G06N3/08 ; G06N3/04 ; G06F16/35

摘要：

本申请涉及一种基于语言模型的语言识别方法、文本分类方法和装置、计算机设备和存储介质，包括：获取训练语句对应的训练词向量，将其分别输入到待训练的第一模型和已训练的第二模型中，得到第一模型的各个第一网络层输出的特征矩阵，以及第二模型的各个第二网络层输出的特征矩阵；第一网络层和第二网络层一一对应，第一模型的网络层层数小于第二模型的网络层层数；将各个第一网络层输出的特征矩阵与各个第一网络层所对应的第二网络层输出的特征矩阵进行相似计算，得到各个相似度，基于各个相似度调整第一模型的模型参数，直到更新后的目标相似度满足收敛条件，得到已训练的第一模型，通过第一模型进行语言识别。采用本方法能够提高模型训练效率。

公开/授权文献

CN111554268A 基于语言模型的语言识别方法、文本分类方法和装置公开/授权日：2020-08-18

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）