- 专利标题: 多模态的对话生成模型的训练方法、装置及电子设备
-
申请号: CN202111598876.7申请日: 2021-12-24
-
公开(公告)号: CN114416934B公开(公告)日: 2023-02-07
- 发明人: 吴文权 , 郭振
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦二层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦二层
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 杜月
- 主分类号: G06F16/332
- IPC分类号: G06F16/332 ; G06V40/16 ; G06V20/40 ; G06V10/82 ; G06N3/04 ; G06N3/08 ; G10L15/06 ; G10L15/16 ; G10L15/22 ; G10L15/24
摘要:
本公开提供了一种多模态的对话生成模型的训练方法、装置及电子设备,涉及计算机技术领域,尤其涉及自然语言处理、深度学习、计算机视觉等人工智能技术领域。包括:获取第一训练数据集,其中,第一训练数据集中包括第一对话语料对;基于第一训练数据集,对初始对话生成模型进行预训练,以生成参考对话生成模型;获取第二训练数据集,其中,第二训练数据集中包括第二对话语料对及对应的人脸图像;基于第二训练数据集及第一预设的调整权重,对参考对话生成模型及图像特征提取网络进行修正训练,以获取多模态的对话生成模型。由此,使得生成的多模态的对话生成模型既能具有较强的文本对话能力,又能准确地预测出语音输入信号对应的答复信号。
公开/授权文献
- CN114416934A 多模态的对话生成模型的训练方法、装置及电子设备 公开/授权日:2022-04-29