朗读评测方法、装置、设备、存储介质及计算机程序产品

    公开(公告)号:CN118098290A

    公开(公告)日:2024-05-28

    申请号:CN202410151287.1

    申请日:2024-02-02

    摘要: 本申请提出一种朗读评测方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取朗读文本对应的目标音素序列;所述目标音素序列中对应多发音单词的目标音素位置具有多个音素;基于每个音素位置上所有音素的嵌入向量表示,生成所述目标音素序列的嵌入向量表示;对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列;基于所述标准朗读音素序列进行朗读评测。整个过程不再依赖于强制切分,避免了不良切分效果所造成的影响,提升了评测结果的稳定性。

    口语评测方法、装置及系统
    2.
    发明公开

    公开(公告)号:CN118053448A

    公开(公告)日:2024-05-17

    申请号:CN202410174889.9

    申请日:2024-02-07

    IPC分类号: G10L25/51 G10L15/26 G10L15/30

    摘要: 本发明提供一种口语评测方法、装置及系统,所述方法包括:确定待评测语音以及待评测语音对应的题目文本;对待评测语音进行语音识别,得到语音识别文本;基于题目文本对应的特征提取模型,提取语音识别文本的潜在评分特征;对语音识别文本的原始评分特征以及潜在评分特征进行融合,得到融合特征;将融合特征发送至服务端,以使服务端基于融合特征确定待评测语音的评测结果。本发明通过潜在评分特征对原始评分特征进行补充,避免传统方法中在人工制作答案无法覆盖所有正确答案情况下影响评测效果的问题。本发明减轻了服务端的运算压力,不仅可以提高服务端的评测响应速度,而且降低了服务端的硬件性能要求,节约了评测成本。

    一种朗读评测方法和装置、电子设备、存储介质

    公开(公告)号:CN117935863A

    公开(公告)日:2024-04-26

    申请号:CN202311708186.1

    申请日:2023-12-12

    IPC分类号: G10L25/60 G10L25/27

    摘要: 本申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。

    特征提取方法、装置、电子设备和存储介质

    公开(公告)号:CN117789756A

    公开(公告)日:2024-03-29

    申请号:CN202311810523.8

    申请日:2023-12-25

    摘要: 本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。

    词序列语言模型优化方法、装置、设备及可读存储介质

    公开(公告)号:CN118194861A

    公开(公告)日:2024-06-14

    申请号:CN202410366308.1

    申请日:2024-03-28

    IPC分类号: G06F40/284 G06F40/216

    摘要: 本申请公开了一种词序列语言模型优化方法、装置、设备及可读存储介质,先利用通用场景的语料训练得到通用词序列语言模型,以及利用特定领域场景的语料训练得到领域词序列语言模型,通过对对通用词序列语言模型和领域词序列语言模型进行融合,能够将通用词序列语言模型在通用场景的预测能力以及领域词序列语言模型在特定领域场景的预测能力组合起来,可以综合利用通用词序列语言模型和领域词序列语言模型各自的优势,在保证高频词的预测能力的同时,能够提升低频词的预测能力,从而改善语言模型在不同场景下的泛化能力,提升预测结果的准确性。

    一种语音评测方法及相关装置

    公开(公告)号:CN110797049B

    公开(公告)日:2022-06-07

    申请号:CN201910987884.7

    申请日:2019-10-17

    IPC分类号: G10L25/60

    摘要: 本申请实施例公开了一种语音评测方法及相关装置。其中,所述方法包括:获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,其中,所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零,所述发音混淆事件是指一语音单元混淆为其他语音单元的事件;输出所述评测得分。可见,通过实施本申请提供的技术方案,有利于提高电子设备进行语音评测的灵活性和兼容性。

    朗读评分方法、装置、设备及可读存储介质

    公开(公告)号:CN111105813A

    公开(公告)日:2020-05-05

    申请号:CN201911424069.6

    申请日:2019-12-31

    摘要: 本申请实施例公开了一种朗读评分方法、装置、设备及可读存储介质,根据待评测语音的语音特征和至少一个评分员的评分尺度特征,确定与每一个评分员对应的待评测语音的初始评分;根据各个评分员对应的待评测语音的初始评分,确定待评测语音的评分。本申请实施例提供朗读评分方法,除了考虑语音本身的语音特征外,还考虑了评分员的评分尺度对评分的影响,从而所确定的待评测语音的评分是与评分员的评分尺度相对应的评分,提高了待评测语音的评分的准确性。

    语言评测方法及相关装置、设备和存储介质

    公开(公告)号:CN118335120A

    公开(公告)日:2024-07-12

    申请号:CN202410256289.7

    申请日:2024-03-06

    IPC分类号: G10L25/60 G10L25/30

    摘要: 本申请公开了一种语言评测方法及相关装置、设备和存储介质,其中,语言评测方法包括:获取目标对象朗读目标文本的音频信息,作为待测音频;获取目标文本的第一发音序列,以及获取待测音频中顺序排列的各个语音段的第二发音序列;基于第一发音序列与语音段的第二发音序列之间的匹配结果,确定语音段对应于目标文本中的位置信息;基于各个语音段和语音段对应于目标文本中的位置信息,得到待测音频的评测结果。上述方案,能够提升语言评测的准确性。

    音质检测方法及相关装置、设备和存储介质

    公开(公告)号:CN117995219A

    公开(公告)日:2024-05-07

    申请号:CN202410141340.X

    申请日:2024-01-31

    IPC分类号: G10L25/60 G10L25/24 G10L25/30

    摘要: 本申请公开了一种音质检测方法及相关装置、设备和存储介质,其中,音质检测方法包括:基于待测音频中的语音段,提取得到目标频谱图;基于目标频谱图,生成代表语音段的第一音频特征;基于第一音频特征中各个元素位置的重要度,编码得到第二音频特征;其中,元素位置的重要度表征元素位置的特征元素相对于各个元素位置的特征元素而言对于音质检测的重要程度;基于第二音频特征进行分类预测,得到表征待测音频质量情况的分类结果。上述方案,能够提升音质检测的准确性和鲁棒性。

    判决辅助方法、装置、电子设备和存储介质

    公开(公告)号:CN117670600A

    公开(公告)日:2024-03-08

    申请号:CN202311792950.8

    申请日:2023-12-22

    摘要: 本发明提供一种判决辅助方法、装置、电子设备和存储介质,其中方法包括:获取待判决的案情文本;确定与所述案情文本的文本内容相关联的参考法条;基于所述案情文本,以及所述参考法条,确定所述案情文本的辅助判决结果。本发明提供的方法、装置、电子设备和存储介质,通过确定与案情文本的文本内容相关联的参考法条,基于案情文本,以及参考法条,确定案情文本的辅助判决结果,在辅助判决过程中引入了专业且相关联的法律知识,提升了辅助判决结果的准确性、可靠性和充实性,进而使得司法智能化在司法领域的应用更加广泛和可靠。