专利检索 ap:("科大讯飞股份有限公司") AND inv:"杨康" 第 2 页

11.

发明授权
一种针对音频的评测方法及装置有权

公开(公告)号：CN109979482B

公开(公告)日：2021-12-07

申请号：CN201910423218.0

申请日：2019-05-21

申请人： 科大讯飞股份有限公司

发明人： 江勇军 , 吴奎 , 朱群 , 杨康 , 竺博 , 潘嘉 , 魏思 , 王智国

IPC分类号： G10L25/03 , G10L25/30 , G10L25/51

摘要： 本发明提供了一种针对音频的评测方法及装置，依据音频和音频的文本，计算得到评测特征，并获取音频中的局部音频的目标局部特征，最后依据评测特征确定的整体评测结果和依据目标局部特征确定的局部评测结果，得到音频的评测结果。所以本申请提供的方法及装置，不仅将整个音频的特征作为评测依据，还将局部音频的特征也作为评测依据，因此，从多个维度对音频进行精细的评测，从而提高了评测的准确性。

12.

发明公开
语音识别方法、装置、设备及存储介质审中-实审

公开(公告)号：CN118072717A

公开(公告)日：2024-05-24

申请号：CN202410198222.2

申请日：2024-02-22

申请人： 科大讯飞股份有限公司

发明人： 杨康 , 吴奎 , 张凯波 , 李宝善 , 盛志超 , 王士进 , 刘聪 , 胡国平

IPC分类号： G10L15/02 , G10L15/05 , G10L15/06 , G10L15/20 , G10L15/22 , G10L15/26 , G10L15/16

摘要： 本申请实施例公开了一种语音识别方法、装置、设备及存储介质，获取待识别语音的有声段边界内的各语音帧的声学特征后，对各语音帧的声学特征进行规整，得到各个语音帧的规整后特征；其中，任一语音帧的规整后特征由该任一语音帧的静态特征、该任一语音帧的静态特征的一阶差分信息和二阶差分信息构成；基于各个语音帧的规整后特征进行语音识别，获得语音识别结果。本申请通过有声段边界内的各语音帧的声学特征中的静态特征部分对有声段边界内的各语音帧的声学特征进行规整，进而利用有声段边界内各语音帧的规整后的声学特征进行语音识别，提高了语音识别的抗噪能力。

13.

发明公开
语音质量检测方法和相关方法、装置、设备和存储介质审中-实审

公开(公告)号：CN117912450A

公开(公告)日：2024-04-19

申请号：CN202410034643.1

申请日：2024-01-09

申请人： 科大讯飞股份有限公司

发明人： 杨康 , 李宝善 , 吴奎 , 张凯波 , 盛志超

IPC分类号： G10L15/01 , G10L15/02 , G10L15/06 , G10L15/08 , G10L15/26

摘要： 本申请公开了一种语音质量检测方法和相关方法、装置、设备和存储介质。该方法包括：提取目标语音的声学特征；基于声学特征进行识别，得到目标语音中各音频帧的音素概率和目标语音的识别文本；基于参考词典，获取识别文本中各个字符的音素发音，并基于识别文本中各个字符的音素发音，得到若干候选发音路径；其中，若干候选发音路径上各音素形成候选音素序列；基于音频帧的音素概率和若干候选发音路径，得到目标语音关于至少一种发音质量指标的检测值。上述方案，能够提高对目标语音发音质量检测的准确度。

14.

发明授权
朗读评分方法、装置、设备及可读存储介质有权

公开(公告)号：CN111105813B

公开(公告)日：2022-09-02

申请号：CN201911424069.6

申请日：2019-12-31

申请人： 科大讯飞股份有限公司

发明人： 吴奎 , 竺博 , 杨康 , 朱群 , 江勇军

IPC分类号： G10L25/30 , G10L25/51 , G06K9/00 , G06K9/62 , G06Q10/06 , G06Q50/20

摘要： 本申请实施例公开了一种朗读评分方法、装置、设备及可读存储介质，根据待评测语音的语音特征和至少一个评分员的评分尺度特征，确定与每一个评分员对应的待评测语音的初始评分；根据各个评分员对应的待评测语音的初始评分，确定待评测语音的评分。本申请实施例提供朗读评分方法，除了考虑语音本身的语音特征外，还考虑了评分员的评分尺度对评分的影响，从而所确定的待评测语音的评分是与评分员的评分尺度相对应的评分，提高了待评测语音的评分的准确性。

15.

发明公开
一种针对音频的评测方法及装置有权

公开(公告)号：CN109979482A

公开(公告)日：2019-07-05

申请号：CN201910423218.0

申请日：2019-05-21

申请人： 科大讯飞股份有限公司

发明人： 江勇军 , 吴奎 , 朱群 , 杨康 , 竺博 , 潘嘉 , 魏思 , 王智国

IPC分类号： G10L25/03 , G10L25/30 , G10L25/51

摘要： 本发明提供了一种针对音频的评测方法及装置，依据音频和音频的文本，计算得到评测特征，并获取音频中的局部音频的目标局部特征，最后依据评测特征确定的整体评测结果和依据目标局部特征确定的局部评测结果，得到音频的评测结果。所以本申请提供的方法及装置，不仅将整个音频的特征作为评测依据，还将局部音频的特征也作为评测依据，因此，从多个维度对音频进行精细的评测，从而提高了评测的准确性。

16.

发明公开
文本位置匹配方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN117995196A

公开(公告)日：2024-05-07

申请号：CN202410033784.1

申请日：2024-01-09

申请人： 科大讯飞股份有限公司

发明人： 苏涛 , 杨康 , 李宝善 , 王超 , 王慧娟 , 张凯波 , 吴奎

IPC分类号： G10L15/26 , G06F18/22 , G10L15/02 , G10L25/48 , G10L25/24 , G10L25/03

摘要： 本发明提供一种文本位置匹配方法、装置、电子设备和存储介质，其中方法包括：获取待匹配文本的音频，对音频中当前时段的音频段进行发音识别，得到当前时段的识别发音；将当前时段的识别发音与发音图网络中的各节点进行匹配，得到识别发音在待匹配文本中所处位置的匹配结果，发音图网络中的各节点基于待匹配文本中各文字的发音构建；基于发音图网络，对历史匹配结果进行回溯和修正，得到文本位置匹配结果，历史匹配结果包括当前时段的匹配结果和当前时段之前时段的匹配结果。本发明提供的方法、装置、电子设备和存储介质，可以支持文本位置在线实时匹配，并支持匹配结果动态修正，从而提高文本位置匹配的准确性和稳定性。

17.

发明公开
一种语音评测方法及相关装置有权

公开(公告)号：CN110797049A

公开(公告)日：2020-02-14

申请号：CN201910987884.7

申请日：2019-10-17

申请人： 科大讯飞股份有限公司

发明人： 杨康 , 吴奎 , 朱群 , 江勇军 , 宋雪洁

IPC分类号： G10L25/60

摘要： 本申请实施例公开了一种语音评测方法及相关装置。其中，所述方法包括：获取用户朗读目标文本所得的目标语音，以及获取所述目标文本的基准语音；根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分，其中，所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零，所述发音混淆事件是指一语音单元混淆为其他语音单元的事件；输出所述评测得分。可见，通过实施本申请提供的技术方案，有利于提高电子设备进行语音评测的灵活性和兼容性。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类