分析音频文件的语音特征的方法和装置

    公开(公告)号:CN104700831A

    公开(公告)日:2015-06-10

    申请号:CN201310652731.X

    申请日:2013-12-05

    IPC分类号: G10L15/06 G10L25/51

    摘要: 本发明公开了一种分析音频文件的语音特征的方法和装置,该分析方法包括:采用多种声学模型对音频文件中的语音内容进行语音识别,以获得多个识别结果;对比所述多个识别结果以获得对比结果;基于对比结果确定所述音频文件的语音声学特征。分析装置与上述分析方法相对应。本发明还提供了基于以上分析的音频文件的语音特征向用户推荐音频文件的方法和装置。利用本发明实施例的方法和装置,可以对音频文件进行语音分析,从而为用户提供关于音频文件中语音内容特点的丰富信息。基于这样的信息,还可以为用户推荐适合用户水平的音频文件。

    情感语音合成方法和系统

    公开(公告)号:CN102385858B

    公开(公告)日:2013-06-05

    申请号:CN201010271135.3

    申请日:2010-08-31

    IPC分类号: G10L13/02

    CPC分类号: G10L13/10 G10L13/02 G10L13/08

    摘要: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。

    用于实时网络通信的方法、实时多语种通信的方法及系统

    公开(公告)号:CN102017513B

    公开(公告)日:2013-05-22

    申请号:CN200980115671.X

    申请日:2009-03-10

    IPC分类号: H04L9/32

    摘要: 一种用于实时网络通信的系统及方法,提供会话标识符(会话ID)作为用于在客户端之间的群组通信(20,22)的公开密钥,并且提供表示多个客户端(12)中的每一个的私有密钥的频道标识符(频道ID)。该频道标识符包括客户端特定属性,该属性用以指示该群组通信的分组准则。基于该公开密钥及私有密钥组合经由网络建立介于客户端(12)与服务(14)之间的动态通信链路,以使得基于该私有密钥及该公开密钥的该属性而实现群组通信。通过使用翻译服务(16)来翻译通信,该翻译服务(16)使用与该私有密钥及该公开密钥的组合相关联的该属性而以指定语言提供响应信息以实现多语种实时通信。

    基于语音的生物认证方法及设备

    公开(公告)号:CN104217149B

    公开(公告)日:2017-05-24

    申请号:CN201310210886.8

    申请日:2013-05-31

    IPC分类号: G06F21/32

    摘要: 本发明公开了一种用户认证的方法和设备。所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段具有相应的在认证之前训练出的文本相关的说话人识别模型;响应于接收所述语音回答,从述语音回答中切分出所述语音片段部分以及动态问题答案部分;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。通过所述方法和设备,可以更为有效的防止用户认证时的录音欺诈。

    基于模式的音频检索方法和系统

    公开(公告)号:CN103853749A

    公开(公告)日:2014-06-11

    申请号:CN201210505562.2

    申请日:2012-11-30

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30743

    摘要: 本发明提供了一种基于模式的音频检索方法和系统。所述音频检索方法包括:基于模式对多个源音频数据进行标记,以获取各源音频数据的音频标记序列;获取目标音频数据的音频标记序列;基于目标音频数据的音频标记序列和各源音频数据的音频标记序列,根据预定匹配规则确定目标音频数据与源音频数据之间的匹配度;以及输出匹配度高于预定匹配度阈值的源音频数据,作为检索结果。利用本发明的方法和系统,能够无需人工参与标记而自动基于背景模式迭代地进行音频类标记和检索,从而提供更准确合理的音频检索结果。

    一种数据处理方法、展示方法和相应的装置

    公开(公告)号:CN103544140A

    公开(公告)日:2014-01-29

    申请号:CN201210241787.1

    申请日:2012-07-12

    IPC分类号: G06F17/27

    摘要: 本发明属于语音识别领域,公开了一种数据处理方法,所述方法包括:获取展示内容对应的文本信息,所述展示内容包括多个区域;对所述文本信息进行文本分析,得到第一关键词序列,所述第一关键词序列包括与所述多个区域中至少一个区域关联的区域关键词;获取与所述展示内容相关的语音信息,所述语音信息至少包括当前语音片断;使用第一模型网络对所述当前语音片断进行分析,以判断所述当前语音片断所对应的区域,其中所述第一模型网络包括所述第一关键词序列。相应的本发明还公开了一种展示方法、以及相应的用于数据处理的装置和用于展示的装置。通过本发明提供的技术方案,可以实现语音片断与展示内容不同区域的关联,进而实现展示内容按照区域的自动跳转。

    语音韵律评估方法与系统

    公开(公告)号:CN102237081A

    公开(公告)日:2011-11-09

    申请号:CN201010163229.9

    申请日:2010-04-30

    IPC分类号: G10L15/00 G10L15/08 G10L15/02

    CPC分类号: G10L25/48

    摘要: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括:接收输入语音数据;获取韵律约束条件;按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及提供所述评估的结果。所述系统包括:输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制,也就是说用户可以根据特定文字/语音进行朗读或者跟读,也可以自由发挥。