多模态的对话生成模型的训练方法、装置及电子设备

发明授权

CN114416934B 多模态的对话生成模型的训练方法、装置及电子设备有权

请登陆查看更多内容

专利标题： 多模态的对话生成模型的训练方法、装置及电子设备
申请号： CN202111598876.7

申请日： 2021-12-24
公开(公告)号： CN114416934B

公开(公告)日： 2023-02-07
发明人: 吴文权 , 郭振
申请人： 北京百度网讯科技有限公司
申请人地址： 北京市海淀区上地十街10号百度大厦二层
专利权人： 北京百度网讯科技有限公司
当前专利权人： 北京百度网讯科技有限公司
当前专利权人地址： 北京市海淀区上地十街10号百度大厦二层
代理机构： 北京清亦华知识产权代理事务所
代理商 杜月
主分类号： G06F16/332
IPC分类号： G06F16/332 ; G06V40/16 ; G06V20/40 ; G06V10/82 ; G06N3/04 ; G06N3/08 ; G10L15/06 ; G10L15/16 ; G10L15/22 ; G10L15/24

摘要：

本公开提供了一种多模态的对话生成模型的训练方法、装置及电子设备，涉及计算机技术领域，尤其涉及自然语言处理、深度学习、计算机视觉等人工智能技术领域。包括：获取第一训练数据集，其中，第一训练数据集中包括第一对话语料对；基于第一训练数据集，对初始对话生成模型进行预训练，以生成参考对话生成模型；获取第二训练数据集，其中，第二训练数据集中包括第二对话语料对及对应的人脸图像；基于第二训练数据集及第一预设的调整权重，对参考对话生成模型及图像特征提取网络进行修正训练，以获取多模态的对话生成模型。由此，使得生成的多模态的对话生成模型既能具有较强的文本对话能力，又能准确地预测出语音输入信号对应的答复信号。

公开/授权文献

CN114416934A 多模态的对话生成模型的训练方法、装置及电子设备公开/授权日：2022-04-29

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/33	..••查询
G06F16/332	...•••查询公式