-
公开(公告)号:CN113076760B
公开(公告)日:2024-01-26
申请号:CN202010006182.9
申请日:2020-01-03
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/58 , G06F16/33 , G06Q30/0601
摘要: 本发明实施例提供了一种翻译、商品检索方法、装置、电子设备及计算机存储介质。其中,翻译方法包括:获取并记录待翻译的源语言搜索词;使用第一翻译模型将待翻译的源语言搜索词同步翻译为目标语言搜索词,并对目标语言搜索词进行缓存;使用第二翻译模型对记录的待翻译的源语言搜索词进行异步翻译,使用异步翻译的结果更新缓存的目标语言搜索词;其中,第一翻译模型的翻译速度大于第二翻译模型,第二翻译模型的翻译质量大于第一翻译模型。通过本发明实施例,可以保证翻译的时延低,且提升翻译准确性。
-
公开(公告)号:CN113076760A
公开(公告)日:2021-07-06
申请号:CN202010006182.9
申请日:2020-01-03
申请人: 阿里巴巴集团控股有限公司
摘要: 本发明实施例提供了一种翻译、商品检索方法、装置、电子设备及计算机存储介质。其中,翻译方法包括:获取并记录待翻译的源语言搜索词;使用第一翻译模型将待翻译的源语言搜索词同步翻译为目标语言搜索词,并对目标语言搜索词进行缓存;使用第二翻译模型对记录的待翻译的源语言搜索词进行异步翻译,使用异步翻译的结果更新缓存的目标语言搜索词;其中,第一翻译模型的翻译速度大于第二翻译模型,第二翻译模型的翻译质量大于第一翻译模型。通过本发明实施例,可以保证翻译的时延低,且提升翻译准确性。
-
公开(公告)号:CN111563388A
公开(公告)日:2020-08-21
申请号:CN201910114343.3
申请日:2019-02-14
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/58 , G06F16/953 , G06N5/02
摘要: 本申请实施例提供了一种信息处理方法及装置。在本申请中,对于任意一个领域,该领域的翻译模型都是基于该领域中的第一语言的训练文本和训练文本在第二语言上的翻译文本训练得到的。对于其他每一个领域,同样如此。为多个领域只需训练出一个通用的语音识别模型,然后基于第一语言的训练文本以及语音识别模型训练纠错模型,且在训练纠错模型时无需人工收集数据和标注数据,降低了人工的工作量。因此,相比于现有技术,在不影响翻译准确率的情况下,本申请可以支持训练出一个通用的语音识别模型,而无需为每一个领域分别训练出一个识别模型,从而可以节省现有技术中的训练语音识别模型过程中所需的人工成本。
-
公开(公告)号:CN110930208A
公开(公告)日:2020-03-27
申请号:CN201811094922.8
申请日:2018-09-19
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06Q30/06
摘要: 本发明公开了一种对象搜索方法及装置。其中,该方法包括:接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果。本发明解决了相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。
-
公开(公告)号:CN112446222A
公开(公告)日:2021-03-05
申请号:CN201910763083.2
申请日:2019-08-16
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/58 , G06F16/31 , G06F16/33 , G06F16/953 , G06Q30/06
摘要: 本发明公开了一种翻译优化方法、装置及处理器。其中,该方法包括:获取多个目标查询语句与多个目标查询语句的翻译结果,其中,目标查询语句为满足预设条件的查询语句,预设条件用于表征目标领域下查询语句的翻译准确度;至少基于多个目标查询语句与多个目标查询语句的翻译结果,训练目标机器翻译系统;基于目标机器翻译系统对目标领域下的待翻译的查询语句进行翻译。本发明解决了相关技术中在特定领域中进行跨语言查询时,查询语句的翻译准确度低导致查询结果的被采纳情况差的技术问题。
-
公开(公告)号:CN112446221A
公开(公告)日:2021-03-05
申请号:CN201910748667.2
申请日:2019-08-14
申请人: 阿里巴巴集团控股有限公司
摘要: 本发明实施例提供了一种机器翻译评估方法、装置、系统及计算机存储介质,其中,翻译评估方法包括:获取包括原文语句和对应的机器译文语句的待评估数据;将所述待评估数据输入翻译评估神经网络模型的第一部分,通过所述第一部分的编码器、基于注意力机制的正向解码器和反向解码器,获得第一部分输出数据,其中,所述第一部分输出数据包括:与所述原文语句对应的译文预测语句和所述译文预测语句的语义特征信息;将所述第一部分输出数据输入翻译评估神经网络模型的第二部分,获得所述机器译文语句的机器翻译质量评估结果。通过本发明实施例,降低了机器翻译质量评估的实现成本,提高了质量评估效率。
-
公开(公告)号:CN112084766A
公开(公告)日:2020-12-15
申请号:CN201910505497.5
申请日:2019-06-12
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/211 , G06F40/53
摘要: 本发明公开了一种文本处理方法和装置、存储介质和处理器。其中,该方法包括:确定待处理的语句;采用文本顺滑模型对语句进行处理,得到语句对应的顺滑结果,其中,文本顺滑模型是采用带不顺滑标注的语料训练的模型;对顺滑结果使用语言模型进行排序处理,得到语句对应的最终的顺滑结果,其中,语言模型为采用流利语句的语料训练的模型。本发明解决了由于标注数据有限造成的文本顺滑效果较差的技术问题。
-
公开(公告)号:CN112084766B
公开(公告)日:2024-01-23
申请号:CN201910505497.5
申请日:2019-06-12
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/211 , G06F40/53
摘要: 本发明公开了一种文本处理方法和装置、存储介质和处理器。其中,该方法包括:确定待处理的语句;采用文本顺滑模型对语句进行处理,得到语句对应的顺滑结果,其中,文本顺滑模型是采用带不顺滑标注的语料训练的模型;对顺滑结果使用语言模型进行排序处理,得到语句对应的最终的顺滑结果,其中,语言模型为采用流利语句的语料训练的模型。本发明解决了由于标注数据有限造成的文本顺滑效果较差的技术问题。
-
公开(公告)号:CN111737550B
公开(公告)日:2024-01-23
申请号:CN201910227199.4
申请日:2019-03-25
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F16/953 , G06F16/9538
摘要: 本发明公开了一种搜索结果处理方法及装置、存储介质和处理器。其中,该方法包括:在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同;将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种;基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果;对多个搜索结果进行排序,返回排序后的搜索结果。本发明解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
-
公开(公告)号:CN114065776A
公开(公告)日:2022-02-18
申请号:CN202010750886.7
申请日:2020-07-30
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F40/58
摘要: 本发明公开一种神经网络机器翻译方法及装置,该神经网络机器翻译方法包括:对获取的多个源端序列进行编码处理,得到当前词的全局编码结果,对所述多个源端序列中当前词所在当前序列进行编码处理,得到当前词的局部编码结果;根据已翻译完成的目标语句对应的目标端序列、所述当前词的局部编码结果和全局编码结果进行解码,得到当前词的局部解码中间状态和全局解码中间状态;对所述局部解码中间状态和所述全局解码中间状态进行融合处理,得到当前词的解码结果。本发明解决了现有技术中翻译结果准确度低的问题。
-
-
-
-
-
-
-
-
-