一种语音识别方法、装置、设备及存储介质

    公开(公告)号:CN116343764A

    公开(公告)日:2023-06-27

    申请号:CN202211311416.6

    申请日:2022-10-25

    Abstract: 本申请实施例中公开了一种语音识别方法、装置、设备及存储介质。其中,该方法包括:接收待识别语音信息;获取待识别语音信息对应的语种信息;根据语种信息确定语音识别模型包括的编码器中对应的语种残差模块;利用语种残差模块对待识别语音信息进行识别,得到初步识别结果;将初步识别结果输入语音识别模型包括的解码器进行识别,得到语音识别结果。可见,本申请实施例中根据语种信息能确定特定的语种残差模块对待识别语音信息进行识别,从而使得语音识别更具针对性,能更好地提升编码器对多语种信息的区分能力与提取能力,进而能提高语音识别准确性。

    一种语音识别方法及相关装置
    2.
    发明公开

    公开(公告)号:CN119724187A

    公开(公告)日:2025-03-28

    申请号:CN202411981844.9

    申请日:2024-12-31

    Abstract: 本申请公开了一种语音识别方法及相关装置,涉及语音处理技术领域,包括:在确定待识别语音数据的通用解码文本序列之后,先将通用解码文本序列转换为元素粒度更低的可泛化文本序列,再利用与可泛化文本序列中各元素对应的相似元素对可泛化文本序列进行扩充,得到相应粒度的扩充文本序列;并基于预设的长尾词汇语言模型对可泛化文本序列和扩充文本序列进行重贴分操作,得到长尾解码文本序列;最后,基于通用解码文本序列以及长尾解码文本序列,确定最终的语音识别结果。由于该方案能够得到长尾解码文本序列,因此能够提升最终的语音识别结果是长尾解码文本序列的可能性,因此,能够有效提升端到端语音识别模型的长尾词汇识别效果。

    一种语音识别方法、装置、设备及存储介质

    公开(公告)号:CN116343764B

    公开(公告)日:2025-01-24

    申请号:CN202211311416.6

    申请日:2022-10-25

    Abstract: 本申请实施例中公开了一种语音识别方法、装置、设备及存储介质。其中,该方法包括:接收待识别语音信息;获取待识别语音信息对应的语种信息;根据语种信息确定语音识别模型包括的编码器中对应的语种残差模块;利用语种残差模块对待识别语音信息进行识别,得到初步识别结果;将初步识别结果输入语音识别模型包括的解码器进行识别,得到语音识别结果。可见,本申请实施例中根据语种信息能确定特定的语种残差模块对待识别语音信息进行识别,从而使得语音识别更具针对性,能更好地提升编码器对多语种信息的区分能力与提取能力,进而能提高语音识别准确性。

    设备同步方法、装置、电子设备和存储介质

    公开(公告)号:CN115963893A

    公开(公告)日:2023-04-14

    申请号:CN202211051052.2

    申请日:2022-08-30

    Abstract: 本发明提供一种设备同步方法、装置、电子设备和存储介质,所述方法包括:获取第一设备采集的目标声源的第一音频以及第二设备采集的目标声源的第二音频;确定第一音频与第二音频之间的采样时间偏差以及第一音频与第二音频之间的采样率偏差;基于采样时间偏差以及采样率偏差,对第一设备和第二设备进行同步。本发明提供的设备同步方法、装置、电子设备和存储介质,基于采样时间偏差以及采样率偏差准确对第一设备和第二设备进行同步,提高了设备同步精度。

Patent Agency Ranking