语音与图像同步性衡量模型的训练方法及装置
摘要:
本申请提供一种语音与图像同步性衡量模型的训练方法及装置,该方法包括:将第一图像片段处理为第一图像数据、第一语音片段处理为第一语音数据、第二语音片段处理为第二语音数据,将随机图像片段处理为第二图像数据、随机语音片段处理为第三语音数据,将第一图像数据和第一语音数据组成正样本,将第一图像数据和第二语音数据组成第一负样本,将第一图像数据和第三语音数据组成第二负样本,将第一语音数据或第二语音数据,和第二图像数据组成第三负样本,采用正样本、第一负样本、第二负样本和第三负样本训练语音与图像同步性衡量模型。这样,使得训练样本的类型更加丰富,能够提高语音与图像同步性衡量模型的精确度。
公开/授权文献
0/0