-
公开(公告)号:CN111859997B
公开(公告)日:2024-01-26
申请号:CN202010550591.5
申请日:2020-06-16
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种机器翻译中的模型训练方法、装置、电子设备及存储介质,涉及自然语言处理技术领域、以及深度学习技术领域。具体实现方案为:基于平行语料库,采用机器翻译模型和语义相似度模型,挖掘一组样本的相似目标语句,并创建第一训练样本集;采用第一训练样本集,训练机器翻译模型;基于平行语料库,采用机器翻译模型和语义相似度模型,挖掘一组样本中各样本的负样本,并创建第二训练样本集;采用第二样本训练集,训练语义相似度模型。本申请通过采用上述技术方能,将两个模型的联合训练,能够在训练语义相似度模型的同时,优化机器翻译模型,并反哺语义相似度模型,使得语义相似度模型的准确性进一步得到提高。
-
公开(公告)号:CN111680145B
公开(公告)日:2023-08-15
申请号:CN202010524534.X
申请日:2020-06-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N5/022 , G06N5/04 , G06N3/042 , G06N3/0455 , G06F40/30 , G06F16/332 , G06F16/35 , G06F16/36 , G06F16/2458
摘要: 本申请实施例公开了知识表示学习方法、装置、设备以及存储介质,涉及自然语言处理、深度学习技术领域。该方法的一具体实施方式包括:获取行业训练文本;利用掩码语言模型对行业训练文本中的行业词进行掩码,得到掩码训练文本;将掩码训练文本输入至预训练语言模型,学习得到行业训练文本中的每个字的知识表示。该实施方式利用特定行业的训练文本训练预训练语言模型,提升了预训练语言模型应用到特定行业任务上的效果。此外,在训练过程中,利用掩码语言模型对行业训练文本中的行业词进行掩码,使得预训练语言模型能够结合完整的行业词学习其中每个字的知识表示,从而提升了预训练语言模型对行业词中的每个字的知识表示的学习效果。
-
公开(公告)号:CN109710939B
公开(公告)日:2023-06-09
申请号:CN201811624901.2
申请日:2018-12-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/211 , G06F40/30
摘要: 本申请实施例公开了用于确定主题的方法和装置。该方法的一具体实施方式包括:确定待识别语句序列;计算待识别语句序列与目标领域内主题模板集合中每个主题模板的相似度,其中,主题模板集合中的每个主题模板对应目标领域内至少一个主题中的主题,主题模板包括主题阶段序列,主题阶段包括主题语句序列;根据关联参数确定待识别语句序列的主题,其中,关联参数包括待识别语句序列与主题模板集合中每个主题模板的相似度。该实施方式降低了主题分割过程中的人工成本。
-
公开(公告)号:CN114564971B
公开(公告)日:2023-05-12
申请号:CN202210189268.9
申请日:2022-02-28
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种深度学习模型的训练方法,涉及人工智能领域,尤其涉及自然语言处理技术领域和机器翻译技术领域。具体实现方案为:利用深度学习模型分别处理样本源数据和对应的样本目标数据,得到第一输出值和第二输出值;根据第一输出值和第二输出值,确定正则化函数值;以及根据正则化函数值,调整深度学习模型的参数,得到经预训练的深度学习模型。本公开还提供了一种文本数据处理方法、装置、电子设备和存储介质。
-
公开(公告)号:CN114818748B
公开(公告)日:2023-04-21
申请号:CN202210505671.8
申请日:2022-05-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/58 , G06F40/30 , G06F18/214
摘要: 本公开提供了用于生成翻译模型的方法、翻译方法及装置,涉及计算机技术领域,具体为机器翻译技术领域。具体实现方案为:获取样本语料;确定样本语料的翻译语种标签;基于样本语料在翻译语种标签下的当前翻译结果与整句翻译结果,生成样本语料的标注翻译结果;基于样本语料、翻译语种标签以及标注翻译结果,对待训练模型进行训练,得到训练完成的翻译模型。本实现方式可以降低翻译模型的建模复杂度。
-
公开(公告)号:CN113553864B
公开(公告)日:2023-04-07
申请号:CN202110737812.4
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/58 , G06N3/0455 , G06N3/047 , G06N3/08
摘要: 本公开提出了翻译模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及自然语言处理、深度学习技术领域。具体实现方案为:通过获取训练语料,其中,训练语料包括:源文本样本以及对应的目标文本样本;对源文本样本中的待掩码字符进行掩码处理,得到掩码文本样本;将源文本样本和掩码文本样本作为深度神经网络模型的输入特征,并将目标文本样本和待掩码字符作为深度神经网络模型的输出特征,对深度神经网络模型进行训练,使得深度神经网络模型可对待掩码字符进行预测,学习到部分语言知识,进而将该深度神经网络模型应用于实际翻译任务时,可提高翻译的准确度。
-
公开(公告)号:CN113408305B
公开(公告)日:2023-03-24
申请号:CN202110737842.5
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/58 , G06F18/214 , G06N20/00
摘要: 本公开提供了一种模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。语音翻译模型的训练方法包括:获取原始数据对,所述原始数据对包括第一原始数据和第二原始数据,所述第一原始数据和所述第二原始数据的语言或者模态不同;采用语料生成模型,对所述原始数据对进行处理,以获得生成数据对,所述生成数据对包括第一生成数据和第二生成数据,所述第一生成数据和所述第二生成数据的语言和模态均不同;采用所述生成数据对,训练翻译模型。本公开可以扩展翻译模型的训练数据的规模。
-
公开(公告)号:CN110298045B
公开(公告)日:2023-03-24
申请号:CN201910471418.3
申请日:2019-05-31
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/58
摘要: 本申请实施例提供一种机器翻译方法、装置、设备及存储介质。包括:获取待翻译语句,待翻译语句包括:P个待翻译词;获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N个位置上的概率;根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率;根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。从而可以提高翻译准确率。
-
公开(公告)号:CN114896991B
公开(公告)日:2023-02-28
申请号:CN202210446882.9
申请日:2022-04-26
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/58 , G06F40/30 , G06F40/247
摘要: 本公开提供了一种文本翻译方法、装置、电子设备和存储介质,涉及文本处理领域,尤其涉及智能搜索、人工智能和深度学习领域。具体实现方案为:获取初始文本,并在所述初始文本中确定第一文本;根据所述第一文本,确定第二文本,所述第二文本用于描述所述第一文本;对所述初始文本进行翻译,得到初始翻译文本,并对所述第二文本进行翻译,得到描述翻译文本;根据所述描述翻译文本,对所述初始翻译文本进行更新,得到所述初始文本的目标翻译文本。本公开实施例可以提高文本翻译的准确性。
-
公开(公告)号:CN112507706B
公开(公告)日:2023-01-31
申请号:CN202011520100.9
申请日:2020-12-21
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/279 , G06F40/30 , G06F16/36 , G06F18/214 , G06N20/20
摘要: 本公开公开了知识预训练模型的训练方法、装置和电子设备,涉及语音、自然语言处理、深度学习技术领域。具体实现方案为:获取训练文本,训练文本包括结构化知识文本和对应的文章,结构化知识文本包括头节点、尾节点和头节点和尾节点之间的关系;根据训练文本对待训练的知识预训练模型进行训练。该方法中,待训练的知识预训练模型能够同时学习到常识知识和丰富的语义知识,可实现常识知识和语义知识的联合训练,且不需要将训练实体嵌入到待训练的知识预训练模型,知识预训练模型的性能增益不受到训练实体的嵌入质量的限制,知识预训练模型可从训练文本中的文章中获取丰富的上下文信息,并可进行动态调整,灵活性较高。
-
-
-
-
-
-
-
-
-