文本回复方法、电子设备和计算机可读存储介质

    公开(公告)号:CN118674039A

    公开(公告)日:2024-09-20

    申请号:CN202410573530.9

    申请日:2024-05-09

    摘要: 本申请公开了一种文本回复方法、电子设备和计算机可读存储介质,该方法包括:获取用户选择的目标模型;目标模型对应有教师模型,且均属于对话生成模型,教师模型是利用历史对话文本训练得到的,多个历史对话文本的预测难度相互区别,预测难度与历史对话文本的文本长度和词汇出现频率中的至少一者相关,训练后的教师模型用于指导待训练学生模型对历史对话文本进行回复预测,且在迭代过程中教师模型基于待训练学生模型的预测损失,选择相应预测难度的历史对话文本,直至得到训练后的待训练学生模型作为目标模型;获取用户输入的待回复文本,将待回复文本输入目标模型,得到回复文本。上述方案,能够增强对话生成模型的性能以提高文本回复的准确率。

    对话情感分析模型的训练方法以及相关装置

    公开(公告)号:CN118626914A

    公开(公告)日:2024-09-10

    申请号:CN202410843716.1

    申请日:2024-06-26

    摘要: 本申请公开了一种对话情感分析模型的训练方法以及相关装置,该训练方法包括:获取当前轮次的训练样本;利用多种数据屏蔽方式对训练样本进行调整,得到多种调整样本,并将训练样本及其对应的调整样本输入对话情感分析模型,得到多种情感下训练样本中每个对话段对应的第一预测分布,以及每个调整样本中每个对话段对应的第二预测分布;其中,数据屏蔽方式与数据的模态和生成对象中的至少一者相关;基于训练标签、第一预测分布和第二预测分布,调整对话情感分析模型的参数,直至满足预设收敛条件,得到训练后的对话情感分析模型。本申请的训练方法能够提升模型对不确定性样本的理解和处理。