-
公开(公告)号:CN110210026A
公开(公告)日:2019-09-06
申请号:CN201910458639.7
申请日:2019-05-29
申请人: 北京百度网讯科技有限公司
摘要: 本发明公开了一种语音翻译方法、装置、计算机设备和存储介质。其中方法包括:接收语音数据;对语音数据进行语音识别,得到至少一个语音识别文本;根据至少一个语音识别文本生成一个用于输入至翻译模型的语义向量表示;将语义向量表示输入至翻译模型中以进行翻译。该方法对语音识别所有可能的结果进行压缩表示,能够产生很强的模型容错能力,使得语音翻译不受语音识别错误影响,提高了语音翻译效率。
-
公开(公告)号:CN110164413A
公开(公告)日:2019-08-23
申请号:CN201910394665.8
申请日:2019-05-13
申请人: 北京百度网讯科技有限公司
摘要: 本申请提出一种语音合成方法、装置、计算机设备和存储介质,其中,方法包括:通过一次只生成一个待处理词语的文本语音转换结果,同时能考已处理词语的声音特征,使得产生的文本语音转换结果能够很平滑,不会产生顿挫的感觉,也就是能够接收词语的文本语音转换结果,并且合并一个句子内的子文本语音转换结果片段后,不影响整体效果,在提高语音合成效率的同时保证语音效果,解决了现有技术中的将一个句子拆分成多个文本语音转换结果,容易产生顿挫的语音信号,衔接性非常差,或者是等待语音合成系统生成完整的语音合成结果才能下发给相关设备进行播放导致时间延迟较大的技术问题。
-
公开(公告)号:CN109840274A
公开(公告)日:2019-06-04
申请号:CN201811618506.3
申请日:2018-12-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332
摘要: 本发明提供一种数据处理方法及装置、存储介质。该方法包括:根据预设的维度对待处理数据进行特征识别处理,得到所述待处理数据的维度特征;其中,所述预设的维度包括:行为维度、领域维度和目的维度;从而,根据识别出的各维度特征,对所述待处理数据进行标注。本发明所提供的技术方案,能够降低标注成本,提高处理能力。
-
公开(公告)号:CN109783824A
公开(公告)日:2019-05-21
申请号:CN201811539900.8
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/28
摘要: 本申请提供一种基于翻译模型的翻译方法、装置及存储介质,其中,该方法包括:获取待翻译文本,将该待翻译文本输入到翻译模型中得到翻译文本,该翻译模型是根据历史翻译文本和教师类-学生类框架训练得到的。该技术方案中,利用根据历史翻译文本和教师类-学生类框架训练得到的翻译模型对待翻译文本进行翻译,提高了翻译时的响应速度,提高了用户体验。
-
公开(公告)号:CN108986793A
公开(公告)日:2018-12-11
申请号:CN201811142935.8
申请日:2018-09-28
申请人: 北京百度网讯科技有限公司
摘要: 本发明提出了一种翻译处理方法、装置及设备,其中,方法包括:获取第一语种的第一语音信号,按照预设算法提取第一语音信号的语音特征向量;将语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与第一语音信号对应的第二语种的文本信息;对第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。由此,通过端到端翻译模型将第一语种的语音直接转换为第二语种的文本,避免了将语音识别步骤的错误传递给翻译步骤,提高了语音翻译的准确性。
-
公开(公告)号:CN108766414A
公开(公告)日:2018-11-06
申请号:CN201810712539.8
申请日:2018-06-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开的实施例涉及用于语音翻译的方法、装置、设备和计算机程序产品。该方法包括:接收源语言形式的源语音数据;确定与所述源语音数据对应的音素序列,所述音素序列中的音素表示所述源语言的声音的单位;以及基于所述音素序列,生成目标语言形式的目标语音数据。以这种方式,可以降低错误的语音识别对机器翻译造成的影响,从而提高翻译的准确性。
-
公开(公告)号:CN112528682B
公开(公告)日:2024-10-22
申请号:CN202011540408.X
申请日:2020-12-23
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了语种检测方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理和深度学习等人工智能技术领域。具体实现方案为:获取输入文本;调用第一分类模型对输入文本进行语种检测以生成第一语种识别结果;以及如果第一语种识别结果满足预设条件,则调用第二分类模型对输入文本进行语种检测以生成第二语种识别结果,其中,第二分类模型的识别精度高于第一分类模型的识别精度。本申请实施例的语种检测方法,可以有效地对输入文本的语种进行检测,进而提高语种识别结果的准确性。
-
公开(公告)号:CN113590782B
公开(公告)日:2024-02-09
申请号:CN202110854886.6
申请日:2021-07-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06F40/237 , G06N5/04
摘要: 本公开提供了一种推理模型的训练方法、推理方法及装置,涉及人工智能技术领域,尤其涉及自然语言处理、知识图谱、深度学习技术领域。实现方案为:从知识图谱中采样环状子图;生成环状子图对应的推理语句;以及以推理语句为训练样本,训练推理模型。
-
公开(公告)号:CN111666751B
公开(公告)日:2023-09-29
申请号:CN202010498884.3
申请日:2020-06-04
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06F40/253 , G06F40/30 , G06F16/35 , G06N3/0455 , G06N3/088
摘要: 本申请实施例公开了训练文本扩充方法、装置、设备以及存储介质,涉及自然语言处理、深度学习、知识图谱技术领域。该方法的一具体实施方式包括:识别第一训练文本中存在的实体集合;从所存在的实体集合中选取第一实体;查找第一实体所属的概念下的实体集合;从概念下的实体集合中选取第二实体,其中,第一实体与第二实体不同;利用第二实体替换第一训练文本中的第一实体,得到第二训练文本。该实施方式通过实体替换策略,利用同一概念下的不同实体对训练文本进行实体替换,引入了结构化人工知识的强噪声,从而实现了利用外部知识对训练文本的信息补充,提升了任务所需信息的完整性。
-
公开(公告)号:CN116451673A
公开(公告)日:2023-07-18
申请号:CN202310395274.4
申请日:2023-04-13
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/189 , G06F40/289 , G06N3/0455 , G06N3/045 , G06N3/0499
摘要: 本公开提供了多语言的句向量的获取方法和多语言的编码器的训练方法,涉及人工智能、自然语言处理、机器学习等技术领域。该方法包括:将待处理语句输入到多语言的目标编码器中进行特征提取,获取句向量;目标编码器由以下训练方法训练得到:获取源语句及其参考语句;由多语言的编码器对源语句进行处理,获取第一语句嵌入向量;根据第一语句嵌入向量和参考语句,获取第一融合语句向量;由解码器对第一融合语句向量进行处理,以获取第一预测语句;根据第一预测语句和参考语句对编码器进行调整,得到多语言的目标编码器。本公开可以学习更好的多语言句向量表示,从而提升多语言句向量对齐质量,在高资源语言和低资源语言上都具有良好的整体性能。
-
-
-
-
-
-
-
-
-