一种模型训练方法、装置及系统
    1.
    发明公开

    公开(公告)号:CN116910205A

    公开(公告)日:2023-10-20

    申请号:CN202310752628.6

    申请日:2023-06-25

    摘要: 本发明提供了模型训练方法、装置及系统,所述方法包括构建待训练的对话模型,待训练的对话模型包括生成模型、推断模型和检索模型;基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练,预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据,预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果;基于第一数据和无标注的第二数据形成的训练样本,对预训练后的对话模型进行半监督训练,得到训练好的对话模型,训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力,更加适用于知识型的任务。

    一种社交媒体平台对话数据的处理方法、装置及设备

    公开(公告)号:CN116975243A

    公开(公告)日:2023-10-31

    申请号:CN202210453846.5

    申请日:2022-04-24

    IPC分类号: G06F16/335 G06F16/31

    摘要: 本发明提供一种社交媒体平台对话数据的处理方法、装置及设备,其中,社交媒体平台对话数据的处理方法包括:获取至少一个社交媒体平台的对话数据;对所述至少一个社交媒体平台的对话数据,分别使用所述对话数据专用的第一级过滤器进行过滤处理,得到至少一个社交媒体平台的对话数据的第一级过滤结果;将所述至少一个社交媒体平台的对话数据的第一级过滤结果,输入到通用的第二级过滤器进行过滤处理,得到第二级过滤结果;将所述第二级过滤结果,输入到对话相关性过滤器进行第三级过滤处理,得到最终的目标过滤结果。本发明的方案可以针对于不同的社交媒体平台的对话数据进行对话上下文相关性过滤处理,方便使用,具有极强的通用性和易用性。