模型训练方法、装置、设备及存储介质

    公开(公告)号:CN113313314A

    公开(公告)日:2021-08-27

    申请号:CN202110651638.1

    申请日:2021-06-11

    摘要: 本申请公开了模型训练方法和装置,具体实现方案为:获取用户行为序列样本集;将样本集中的用户行为序列输入至第一模型,得到第一预选条目的概率分布和第一目标条目,其中,第一模型为预先训练的教师模型;将样本集中的用户行为序列作为输入,将第二预选条目的概率分布和第二目标条目作为输出,对第二模型进行训练,得到用户行为预测模型,其中,第二模型为待训练的学生模型,用户行为预测模型的训练目标包括第一目标,第一目标为使第二目标条目对应向量和第一目标条目对应向量保持一致,第一模型和/或第二模型的训练任务包括辅助任务,辅助任务包括时间一致性任务。该方案实现一种数据增强的自监督模仿学习的模型训练方法。

    一种客服问答的方法和装置
    14.
    发明公开

    公开(公告)号:CN118673122A

    公开(公告)日:2024-09-20

    申请号:CN202410881386.5

    申请日:2024-07-02

    摘要: 本发明公开了一种客服问答的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取用户咨询语句,并使用语义特征提取模型对用户咨询语句进行特征向量提取得到用户咨询语句对应的查询嵌入向量;将查询嵌入向量与历史客服问答数据对应的检索嵌入向量集合进行嵌入向量匹配,得到匹配结果;获取匹配结果对应的客服应答语句;基于用户咨询语句和客服应答语句,使用大模型进行问答预测,得到问答结果,将问答结果返回。该实施方式实现了基于深度文本语义检索的方式进行客服应答语句检索,基于大模型对检索到的客服应答语句进行问答预测的智能客服问答,使得电商平台的客服问答结果更准确,应答话术更自然、更贴近人工,提高用户体验度。

    模型训练方法、装置、设备及存储介质

    公开(公告)号:CN113313314B

    公开(公告)日:2024-05-24

    申请号:CN202110651638.1

    申请日:2021-06-11

    摘要: 本申请公开了模型训练方法和装置,具体实现方案为:获取用户行为序列样本集;将样本集中的用户行为序列输入至第一模型,得到第一预选条目的概率分布和第一目标条目,其中,第一模型为预先训练的教师模型;将样本集中的用户行为序列作为输入,将第二预选条目的概率分布和第二目标条目作为输出,对第二模型进行训练,得到用户行为预测模型,其中,第二模型为待训练的学生模型,用户行为预测模型的训练目标包括第一目标,第一目标为使第二目标条目对应向量和第一目标条目对应向量保持一致,第一模型和/或第二模型的训练任务包括辅助任务,辅助任务包括时间一致性任务。该方案实现一种数据增强的自监督模仿学习的模型训练方法。

    物品文案生成网络训练方法、物品文案生成方法、装置

    公开(公告)号:CN113780516A

    公开(公告)日:2021-12-10

    申请号:CN202110084578.X

    申请日:2021-01-21

    摘要: 本公开的实施例公开了物品文案生成网络训练方法、物品文案生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取物品集中每个物品的物品描述信息;对该物品集对应的物品描述信息集进行数据预处理,得到处理后的物品描述信息集;对初始第一物品文案生成网络进行训练,得到训练后的第一物品文案生成网络;利用知识蒸馏方法,对该初始第二物品文案生成网络进行训练,得到训练后的第二物品文案生成网络。该实施方式通过训练后的第一物品文案生成网络指导训练初始第二物品文案生成网络生成物品文案,使得训练后的第二物品文案生成网络可以依据物品的标题信息和物品的属性信息准确、有效的生成物品文案。

    一种对话生成的方法和装置

    公开(公告)号:CN110309275B

    公开(公告)日:2024-06-14

    申请号:CN201810213188.6

    申请日:2018-03-15

    IPC分类号: G06F16/332

    摘要: 本发明公开了一种对话生成的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接收当前轮对话的对话信息,获取上一轮对话的隐状态向量,根据对话信息以及上一轮对话的隐状态向量,确定当前轮对话的隐状态向量;基于当前轮对话的隐状态向量,生成相应的变分隐状态向量,以提取相应的记忆内容向量;至少根据当前轮对话的隐状态向量以及记忆内容向量,生成对话回复信息。该实施方式提供了一种新颖的对话生成思路,结合变分隐变量,以随机读取记忆单元中的记忆内容,进而生成多样化的对话回复;另外,对于记忆内容的提取,提高了对话回复的准确性。

    一种商品分类方法和装置
    18.
    发明公开

    公开(公告)号:CN112529646A

    公开(公告)日:2021-03-19

    申请号:CN201910881276.8

    申请日:2019-09-18

    IPC分类号: G06Q30/06 G06F16/906 G06K9/62

    摘要: 本发明公开了一种商品分类方法和装置,涉及及计算机技术领域。该方法的一具体实施方式包括:获取商品分类训练数据;使用所述商品分类训练数据,基于神经网络,训练得到用于进行商品分类的商品分类模型;根据待分类商品的商品描述信息,使用所述商品分类模型,预测所述待分类商品归属于所述商品分类表中的商品类别的概率,及所述待分类商品的商品描述信息中的词作为商品类别的概率;根据所预测的概率由高到低的顺序,确定所述待分类商品所归属的商品类别。该该具体实施方式保证了商品分类训练数据的有效性及可靠性,实现了对商品的自动分类,同时又能挖掘出可能的新的词汇作为商品分类。

    对话系统处理方法、装置、设备及可读存储介质

    公开(公告)号:CN109582767B

    公开(公告)日:2024-05-17

    申请号:CN201811388674.8

    申请日:2018-11-21

    IPC分类号: G06F16/332 H04L51/02

    摘要: 本发明实施例提供一种对话系统处理方法、装置、设备及可读存储介质,本发明实施例的方法通过获取用户在本轮对话输入的原始语句;根据所述用户在本轮对话输入的原始语句,以及前一轮对话中的对话状态信息,生成本轮对话的对话状态信息;根据所述本轮对话的对话状态信息,生成本轮对话回复的目标语句,采用了拷贝流机制,包括有从前一轮回复到本轮对话状态的复制流程,从本轮对话状态到本轮回复的复制流程,在相邻的对话轮次中,从前一轮对话状态到本轮对话状态的复制流程,通过拷贝流机制,将对话历史的信息流通过复制传递并最终参与本轮对话回复的目标语句的生成,能够实现长期对话状态的跟踪,可以提高对话系统生成的回复的准确性。

    对话系统处理方法、装置、设备及可读存储介质

    公开(公告)号:CN109582767A

    公开(公告)日:2019-04-05

    申请号:CN201811388674.8

    申请日:2018-11-21

    IPC分类号: G06F16/332 H04L12/58

    CPC分类号: H04L51/02

    摘要: 本发明实施例提供一种对话系统处理方法、装置、设备及可读存储介质,本发明实施例的方法通过获取用户在本轮对话输入的原始语句;根据所述用户在本轮对话输入的原始语句,以及前一轮对话中的对话状态信息,生成本轮对话的对话状态信息;根据所述本轮对话的对话状态信息,生成本轮对话回复的目标语句,采用了拷贝流机制,包括有从前一轮回复到本轮对话状态的复制流程,从本轮对话状态到本轮回复的复制流程,在相邻的对话轮次中,从前一轮对话状态到本轮对话状态的复制流程,通过拷贝流机制,将对话历史的信息流通过复制传递并最终参与本轮对话回复的目标语句的生成,能够实现长期对话状态的跟踪,可以提高对话系统生成的回复的准确性。