一种模型训练方法、装置及系统
    1.
    发明公开

    公开(公告)号:CN116910205A

    公开(公告)日:2023-10-20

    申请号:CN202310752628.6

    申请日:2023-06-25

    摘要: 本发明提供了模型训练方法、装置及系统,所述方法包括构建待训练的对话模型,待训练的对话模型包括生成模型、推断模型和检索模型;基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练,预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据,预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果;基于第一数据和无标注的第二数据形成的训练样本,对预训练后的对话模型进行半监督训练,得到训练好的对话模型,训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力,更加适用于知识型的任务。

    数据处理方法、任务预测方法、设备及介质

    公开(公告)号:CN118820410A

    公开(公告)日:2024-10-22

    申请号:CN202311736534.6

    申请日:2023-12-18

    摘要: 本发明提供一种数据处理方法、任务预测方法、设备及介质,涉及人工智能领域,数据处理方法包括:获取第一任务的训练数据的第一特征向量;根据第一特征向量与任务提示信息集合中的任务提示信息的匹配度,确定任务提示信息集合中的第一目标任务提示信息;将第一特征向量与第一目标任务提示信息进行组合,得到第二特征向量;将第二特征向量输入预训练语言模型,得到第一任务的训练数据的预测结果;根据第一任务的训练数据的预测结果和第一任务的训练数据对应的标签,对任务提示信息集合进行调整,得到目标任务提示信息集合。本发明实施例,通过调节和使用任务提示信息集合,从而提高预训练语言模型预测的准确性。

    对话生成方法及装置、对话预测模型的训练方法及装置

    公开(公告)号:CN114969280A

    公开(公告)日:2022-08-30

    申请号:CN202210393967.5

    申请日:2022-04-15

    申请人: 清华大学

    发明人: 欧智坚 刘红

    IPC分类号: G06F16/332 G06N3/08

    摘要: 本申请涉及一种对话生成方法及装置、对话预测模型的训练方法及装置。方法包括:在第t轮对话中,接收客户端发送的第t轮用户输入信息,其中,t为正整数;采用对话预测模型根据第t轮用户输入信息及第t‑1轮预测信息进行对话预测,得到第t轮系统回复信息,第t‑1轮预测信息包括第t‑1轮对话状态和第t‑1轮系统回复信息;向客户端反馈第t轮系统回复信息。采用本方法能够提高系统的数据处理效率,降低系统的响应时间,提高系统的响应效率,且可以提高预测效果。

    基于交叉熵的音频指纹快速搜索方法

    公开(公告)号:CN101853262A

    公开(公告)日:2010-10-06

    申请号:CN200910241366.7

    申请日:2009-12-07

    申请人: 清华大学

    发明人: 欧智坚 林晖

    IPC分类号: G06F17/30

    摘要: 基于交叉熵的音频指纹快速搜索方法,属于音频指纹搜索技术领域,其特征在于,利用共分量高斯混合模型来描述音频指纹,并且用交叉熵来衡量音频指纹间的距离,然后用广义动态时序比对方法,以滑动窗方式将用户指定音频段与输入音频流进行指纹比较,判断该音频流中是否包含有指定音频段。本发明具有能大大地减少距离计算次数,而且还能适应于多种音频失真情况,错误率相对于使用L1距离降低了三分之一的优点,已完成软件实现并在仿真实验中予以测试。

    语音识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN115312043A

    公开(公告)日:2022-11-08

    申请号:CN202210831799.3

    申请日:2022-07-15

    申请人: 清华大学

    发明人: 欧智坚 安柯宇

    IPC分类号: G10L15/16 G10L15/26

    摘要: 本申请涉及一种语音识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别语音的当前帧和当前帧之前的历史帧,并将当前帧和当前帧之前的历史帧作为第一分块,进而根据第一分块和目标合成预测器,模拟出第一分块对应的未来帧,从而根据第一分块、未来帧和目标声学模型,确定待识别语音的语音识别结果。采用本方法能够降低识别的延迟时间。