专利检索 ap:("平安科技(深圳)有限公司") AND inv:"梁浩" 第 1 页

1.

发明授权
声学模型训练方法、语音识别方法、装置、设备及介质有权

公开(公告)号：CN107680582B

公开(公告)日：2021-03-26

申请号：CN201710627480.8

申请日：2017-07-28

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 程宁 , 肖京

IPC分类号： G10L15/02 , G10L15/14 , G10L15/16

摘要： 本发明公开了一种声学模型训练方法、语音识别方法、装置、设备及介质。该声学模型训练方法包括：对训练语音信号进行特征提取，获取音频特征序列；采用音素混合高斯模型‑隐马尔科夫模型对所述音频特征序列进行训练，获取音素特征序列；采用深度神经网络模型‑隐马尔科夫模型‑序列训练模型对所述音素特征序列进行训练，获取目标声学模型。该声学模型训练方法可有效节省声学模型训练所需时间，提高训练效率，并保证识别效率。

2.

发明授权
基于语音的口型动画合成装置、方法及可读存储介质有权

公开(公告)号：CN108763190B

公开(公告)日：2019-04-02

申请号：CN201810327672.1

申请日：2018-04-12

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 肖京

IPC分类号： G06F17/27 , G06N3/08 , G06T13/20 , G10L13/02 , G10L15/02 , G10L15/16 , G10L25/24 , G10L25/30

摘要： 本发明公开了一种基于语音的口型动画合成装置，包括存储器和处理器，存储器上存储有可在处理器上运行的口型动画合成程序，该程序被处理器执行时实现如下步骤：获取目标文本数据，根据发音词典获取目标文本数据中的音素特征；将音素特征输入到预先训练好的深度神经网络模型中，输出声学特征，将声学特征输入到语音合成器中输出语音数据；根据语音数据、预先训练好的张量模型以及说话人标识信息，获取口型数据；根据口型数据生成与语音数据对应的口型动画。发明还提出一种基于语音的口型动画合成方法以及一种计算机可读存储介质。本发明解决了现有技术中无法展示与合成的语音数据匹配的、并具有真实感的口型动画的技术问题。

3.

发明公开
基于语音的口型动画合成装置、方法及可读存储介质有权

公开(公告)号：CN108763190A

公开(公告)日：2018-11-06

申请号：CN201810327672.1

申请日：2018-04-12

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 肖京

IPC分类号： G06F17/27 , G06N3/08 , G06T13/20 , G10L13/02 , G10L15/02 , G10L15/16 , G10L25/24 , G10L25/30

摘要： 本发明公开了一种基于语音的口型动画合成装置，包括存储器和处理器，存储器上存储有可在处理器上运行的口型动画合成程序，该程序被处理器执行时实现如下步骤：获取目标文本数据，根据发音词典获取目标文本数据中的音素特征；将音素特征输入到预先训练好的深度神经网络模型中，输出声学特征，将声学特征输入到语音合成器中输出语音数据；根据语音数据、预先训练好的张量模型以及说话人标识信息，获取口型数据；根据口型数据生成与语音数据对应的口型动画。发明还提出一种基于语音的口型动画合成方法以及一种计算机可读存储介质。本发明解决了现有技术中无法展示与合成的语音数据匹配的、并具有真实感的口型动画的技术问题。

4.

发明公开
利用语音进行疾病预测的方法及应用服务器无效

公开(公告)号：CN108053841A

公开(公告)日：2018-05-18

申请号：CN201710995691.7

申请日：2017-10-23

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 肖京

IPC分类号： G10L25/66 , G10L25/30 , G10L15/02 , G10L15/06

CPC分类号： G10L15/02 , G10L15/063 , G10L25/30 , G10L25/66

摘要： 本发明公开了一种利用语音进行疾病预测的方法，所述方法包括：利用训练数据训练深度神经网络模型，所述训练数据具有特定的语音类别，所述深度神经网络模型具有输入层和输出层；获取实时的患者语音数据；对所述患者语音数据进行数据处理；将处理后的所述患者语音数据送入训练后的所述深度神经网络模型的输入层；获取所述深度神经网络模型的输出层的输出状态；根据获取的所述输出状态判断所述患者语音数据所属的类别。本发明还提供一种应用服务器。本发明提供的利用语音进行疾病预测的方法及应用服务器，可以通过患者的语音快速的对患者进行初步的诊断，进而为后续医生的正式诊断提供一定的数据支撑和参考，进而大大方便了医生和患者。

5.

发明授权
语音识别方法、装置、计算机设备及存储介质有权

公开(公告)号：CN107331384B

公开(公告)日：2018-05-04

申请号：CN201710438772.7

申请日：2017-06-12

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 程宁 , 肖京

IPC分类号： G10L15/02 , G10L15/14

摘要： 本发明提出了一种语音识别方法，该方法包括：获取待识别的语音数据；提取语音数据中的Filter Bank特征和MFCC特征；将MFCC特征作为GMM‑HMM模型的输入数据，获取第一似然概率矩阵；将Filter Bank特征作为二维LSTM模型的输入特征，获取后验概率矩阵；将后验概率矩阵和第一似然概率矩阵作为HMM模型的输入数据，获取第二似然概率矩阵，根据第二似然概率矩阵在音素解码网络中获取对应的目标词序列。该方法通过将混合高斯模型和深度学习模型结合，且采用创新的二维LSTM模型作为声学模型，提高了语音识别的准确度。此外，还提出了一种语音识别装置、计算机设备及存储介质。

6.

发明授权
图片品质的检测方法及装置有权

公开(公告)号：CN106372651B

公开(公告)日：2018-03-06

申请号：CN201610704799.1

申请日：2016-08-22

申请人： 平安科技(深圳)有限公司

发明人： 王健宗 , 马进 , 刘铭 , 郭卉 , 梁浩 , 李佳琳 , 肖京

IPC分类号： G06K9/62 , G06N3/02

CPC分类号： G06K9/62 , G06N3/02

摘要： 本发明涉及一种图片品质的检测方法及装置，所述图片品质的检测方法包括：车险理赔服务器在接收到用户终端上传的理赔照片后，采用预先训练生成的深度卷积神经网络模型对接收到的理赔照片进行清晰度识别，以确定所述理赔照片的清晰度等级；若所述理赔照片的清晰度等级低于预设清晰度等级，则发送第一提示信息至所述用户终端，以提醒用户重新上传理赔照片。本发明通过预先训练生成的深度卷积神经网络模型对理赔照片进行清晰度识别，保证用户所上传的理赔照片均是能够准确地分析得出车险现场信息的理赔照片，这样，有助于提高自助理赔系统的工作效率，提高用户体验。

7.

发明公开
基于情绪识别的语音质检方法、装置、设备及存储介质有权

公开(公告)号：CN107705807A

公开(公告)日：2018-02-16

申请号：CN201710734303.X

申请日：2017-08-24

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 肖京

IPC分类号： G10L25/63 , G06K9/00 , H04M3/51

摘要： 本发明公开一种基于情绪识别的语音质检方法、装置、设备及存储介质。该基于情绪识别的语音质检方法包括：获取待测语音数据；将待测语音数据送入语音情绪识别平台进行情绪识别；将情绪识别结果发送给关联终端，以使关联终端显示情绪识别结果。该基于情绪识别的语音质检方法进行情绪识别时，具有效率高且人工成本低的优点。

8.

发明公开
语音欺诈识别方法、装置、终端设备及存储介质无效

公开(公告)号：CN107680602A

公开(公告)日：2018-02-09

申请号：CN201710734301.0

申请日：2017-08-24

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 肖京

IPC分类号： G10L17/26 , G10L17/04 , G10L17/16 , G10L17/18

CPC分类号： G10L17/26 , G10L17/04 , G10L17/16 , G10L17/18 , H04M2203/6027 , H04M2203/6045

摘要： 本发明公开一种语音欺诈识别方法、装置、终端设备及存储介质。该语音欺诈识别方法包括：获取待测语音信息；对所述待测语音信息进行特征提取，获取语音特征；采用身份确认模型对所述语音特征进行身份验证，获取身份验证信息；采用谎言监控模型对所述语音特征进行谎言验证，获取谎言验证信息；基于所述身份验证信息和所述谎言验证信息，获取欺诈风险评估结果。该语音欺诈识别方法进行语音欺诈识别时，具有效率高、准确率高且人工成本低的优点。

9.

发明公开
声学模型训练方法、语音识别方法、装置、设备及介质有权

公开(公告)号：CN107680582A

公开(公告)日：2018-02-09

申请号：CN201710627480.8

申请日：2017-07-28

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 程宁 , 肖京

IPC分类号： G10L15/02 , G10L15/14 , G10L15/16

CPC分类号： G10L15/02 , G10L15/144 , G10L15/148 , G10L15/16 , G10L2015/0631

摘要： 本发明公开了一种声学模型训练方法、语音识别方法、装置、设备及介质。该声学模型训练方法包括：对训练语音信号进行特征提取，获取音频特征序列；采用音素混合高斯模型-隐马尔科夫模型对所述音频特征序列进行训练，获取音素特征序列；采用深度神经网络模型-隐马尔科夫模型-序列训练模型对所述音素特征序列进行训练，获取目标声学模型。该声学模型训练方法可有效节省声学模型训练所需时间，提高训练效率，并保证识别效率。

10.

发明公开
语音识别方法、装置、计算机设备及存储介质有权

公开(公告)号：CN107633842A

公开(公告)日：2018-01-26

申请号：CN201710445076.9

申请日：2017-06-12

申请人： 平安科技(深圳)有限公司

发明人： 梁浩 , 王健宗 , 程宁 , 肖京

IPC分类号： G10L15/02 , G10L15/14

摘要： 本发明提出了一种语音识别方法，该方法包括：获取待识别的语音数据；提取语音数据中的Filter Bank特征和MFCC特征；将MFCC特征作为GMM-HMM模型的输入数据，获取第一似然概率矩阵；将Filter Bank特征作为具有连接单元LSTM模型的输入特征，获取后验概率矩阵；将后验概率矩阵和第一似然概率矩阵作为HMM模型的输入数据，获取第二似然概率矩阵，根据第二似然概率矩阵在音素解码网络中获取对应的目标词序列。该方法通过将混合高斯模型和深度学习模型结合，且采用创新的具有连接单元LSTM模型作为声学模型，提高了语音识别的准确度。此外，还提出了一种语音识别装置、计算机设备及存储介质。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类