-
公开(公告)号:CN116978367A
公开(公告)日:2023-10-31
申请号:CN202310161423.0
申请日:2023-02-14
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请实施例公开了一种语音识别方法、装置、电子设备和存储介质。本申请实施例利用训练后解码网络对待识别语音进行解码,得到至少一条解码路径输出的候选词,以及所述候选词的基础得分;然后,确定所述候选词中属于热词列表的候选热词,并利用训练后类语言模型对每个候选热词进行热词分类;接着,根据分类结果计算属于训练后类语言模型中预设类别的候选热词的得分调整参数,基于所述得分调整参数更新对应候选热词的基础得分;再然后,基于每条解码路径中所有候选词更新后的基础得分,确定所述待识别语音的识别结果。该方案可以有效地提高语音识别的准确性。
-
公开(公告)号:CN116962600A
公开(公告)日:2023-10-27
申请号:CN202310029109.7
申请日:2023-01-09
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N5/278 , G06V20/62 , G06V30/10 , H04N21/488 , H04N21/4402 , G10L15/26
摘要: 本申请公开了一种字幕内容的显示方法、装置、设备、介质及程序产品,涉及人工智能领域。该方法包括:获取实时视频流中的图像帧和语音讲解流;对图像帧进行字符识别,得到图像帧中包含的字符对应的关键词;构建与关键词对应的关键词拓扑路径;获取与关键词中的字符对应的形近字;对语音讲解流进行语音识别得到语音识别结果,并基于形近字、关键词拓扑路径以及语音识别结果得到实时视频流对应的实时字幕内容。有效的提升实时字幕内容的识别准确率。
-
公开(公告)号:CN118262701A
公开(公告)日:2024-06-28
申请号:CN202211689527.0
申请日:2022-12-27
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种语音识别方法、装置、计算机设备及存储介质,属于语音识别技术领域。所述方法包括:基于热词列表和汉字映射表,构建第一热词解码图和第二热词解码图;基于所述第一热词解码图和基础解码图,对语音信号进行识别,得到初始汉字集合;基于所述第二热词解码图,对所述初始汉字集合中的汉字进行修正,得到所述语音信号的目标汉字集合。上述技术方案,由于热词中汉字的数量与所有汉字的数量相比,数量较少,因此能够较快构建第一热词解码图和第二热词解码图,从而能够根据第一热词解码图和第二热词解码图,对语音信号中的热词进行解码,从而得到语音信号的目标汉字集合,能够提高识别效率。
-
-