训练评分模型的方法、装置、终端及存储介质

    公开(公告)号:CN113836946B

    公开(公告)日:2023-11-14

    申请号:CN202111069233.3

    申请日:2021-09-13

    IPC分类号: G06F40/51 G06F40/30

    摘要: 本申请公开了一种训练评分模型的方法、装置、终端及存储介质,属于互联网技术领域。该方法包括:获取样本原文、第一样本译文以及至少一个第二样本译文,其中,第一样本译文的语义和样本原文对应的语义相同,第二样本译文的语义与第一样本译文的语义不同;将样本原文和第一样本译文输入评分模型,得到第一样本译文对应的第一样本分数,将样本原文分别和每个第二样本译文输入评分模型,得到每个第二样本译文对应的第二样本分数;基于第一样本分数以及至少一个第二样本分数,确定损失信息;基于损失信息,对评分模型进行调整。可见,本申请实施例解决了在没有样本译文对应的基准分数下,无法对评分模型进行训练的问题。

    对话回复的生成方法、装置、设备及存储介质

    公开(公告)号:CN114153953A

    公开(公告)日:2022-03-08

    申请号:CN202111189305.8

    申请日:2021-10-12

    摘要: 本申请公开了一种对话回复的生成方法、装置、设备及存储介质,属于计算机技术领域,该方法包括:获取输入对话序列;根据输入对话序列获取上下文语义信息、知识信息和句法信息,其中,知识信息包括与输入对话序列在内容上关联的知识向量,句法信息包括多样的句法向量;根据上下文语义信息、知识信息和句法信息,生成输入对话序列的对话回复。该方法生成的对话回复兼顾了知识准确性与回复多样性之间的平衡,提升了生成的对话回复的质量。

    训练评分模型的方法、装置、终端及存储介质

    公开(公告)号:CN113836946A

    公开(公告)日:2021-12-24

    申请号:CN202111069233.3

    申请日:2021-09-13

    IPC分类号: G06F40/51 G06F40/30

    摘要: 本申请公开了一种训练评分模型的方法、装置、终端及存储介质,属于互联网技术领域。该方法包括:获取样本原文、第一样本译文以及至少一个第二样本译文,其中,第一样本译文的语义和样本原文对应的语义相同,第二样本译文的语义与第一样本译文的语义不同;将样本原文和第一样本译文输入评分模型,得到第一样本译文对应的第一样本分数,将样本原文分别和每个第二样本译文输入评分模型,得到每个第二样本译文对应的第二样本分数;基于第一样本分数以及至少一个第二样本分数,确定损失信息;基于损失信息,对评分模型进行调整。可见,本申请实施例解决了在没有样本译文对应的基准分数下,无法对评分模型进行训练的问题。

    领域自适应的槽位填充方法、装置、设备及存储介质

    公开(公告)号:CN113821616A

    公开(公告)日:2021-12-21

    申请号:CN202110910430.7

    申请日:2021-08-09

    IPC分类号: G06F16/332 G06F16/33

    摘要: 本申请公开了一种领域自适应的槽位填充方法、装置、设备及存储介质,属于自然语言处理领域。该方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼接为用户输入句对;调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息;根据所述答案位置信息,将所述问句的答案作为槽位实体,填充在所述目标槽位中。本申请将槽位填充问题转化为机器阅读理解问题,利用通用机器阅读理解模型对不同领域的语料都具有较好理解能力的特性,可以实现跨领域的槽位填充能力。

    基于人工智能的拟人回复生成方法、装置和电子设备

    公开(公告)号:CN118277523A

    公开(公告)日:2024-07-02

    申请号:CN202410308297.1

    申请日:2024-03-18

    IPC分类号: G06F16/332 G06F16/35

    摘要: 本发明提供一种基于人工智能的拟人回复生成方法、装置和电子设备,该方法包括:获取目标文本数据及目标文本数据对应的目标向量;对目标向量和多个预设向量进行聚类处理,基于聚类结果以及各预设向量分别对应的预设主题类别确定目标文本数据的主题类别;基于自然语言处理模型,根据目标文本数据的主题确定目标文本数据对应的多个字段,以及各字段分别对应的描述信息和情感倾向;基于多个字段,各字段分别对应的描述信息和情感倾向,以及用户的自定义选项生成目标文本数据对应的拟人回复,自定义选项包括身份类型。本发明确定了目标文本数据的主题类别,提升了回复的准确性。并使得用户能够选择回复的身份,提高了回复的真实性。

    机器翻译质量评估方法、装置、设备及介质

    公开(公告)号:CN112347795B

    公开(公告)日:2024-07-02

    申请号:CN202011066983.0

    申请日:2020-10-04

    摘要: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。

    领域自适应的槽位填充方法、装置、设备及存储介质

    公开(公告)号:CN113821616B

    公开(公告)日:2023-11-14

    申请号:CN202110910430.7

    申请日:2021-08-09

    IPC分类号: G06F16/332 G06F16/33

    摘要: 本申请公开了一种领域自适应的槽位填充方法、装置、设备及存储介质,属于自然语言处理领域。该方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼接为用户输入句对;调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息;根据所述答案位置信息,将所述问句的答案作为槽位实体,填充在所述目标槽位中。本申请将槽位填充问题转化为机器阅读理解问题,利用通用机器阅读理解模型对不同领域的语料都具有较好理解能力的特性,可以实现跨领域的槽位填充能力。

    机器翻译质量评估方法、装置、设备及介质

    公开(公告)号:CN112347795A

    公开(公告)日:2021-02-09

    申请号:CN202011066983.0

    申请日:2020-10-04

    摘要: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。