面向电力领域的语音翻译方法、装置、电子设备及介质

    公开(公告)号:CN118862905A

    公开(公告)日:2024-10-29

    申请号:CN202410845174.1

    申请日:2024-06-27

    IPC分类号: G06F40/58 G06F40/42 G10L15/26

    摘要: 本发明实施例公开了一种面向电力领域的语音翻译方法、装置、电子设备及介质,其中该方法包括:基于电网领域语音翻译数据,构建源语言语音‑源语言文本‑目标语言文本结构的电网领域语音翻译数据集,并分为训练、验证、测试集;获取预训练语音翻译模型;基于所述预训练语音翻译模型,使用所述电网领域语音翻译数据构建特征数据存储;基于邻近算法对所述特征数据进行检索,获得检索概率分布;混合所述检索概率分布与所述语音翻译模型的预测概率分布,确定目标概率分布,以获得翻译后的语言文本。可以使用少量的电力领域语音翻译数据集构建特征数据存储,在解码时查询该数据存储进行辅助解码,提升电力领域语音翻译的翻译效果。