- 专利标题: 语音与图像同步性衡量模型的训练方法及装置
-
申请号: CN202111058177.3申请日: 2021-09-09
-
公开(公告)号: CN114494930B公开(公告)日: 2023-09-22
- 发明人: 王淳 , 曾定衡 , 王洪斌 , 吴海英 , 周迅溢 , 蒋宁
- 申请人: 马上消费金融股份有限公司
- 申请人地址: 重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼
- 专利权人: 马上消费金融股份有限公司
- 当前专利权人: 马上消费金融股份有限公司
- 当前专利权人地址: 重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼
- 代理机构: 北京同立钧成知识产权代理有限公司
- 代理商 杨泽; 刘芳
- 主分类号: G06V20/40
- IPC分类号: G06V20/40 ; G06V40/16 ; G06V10/82 ; G06N3/0464 ; G06N3/08 ; G10L15/04 ; G10L15/06 ; G10L15/16
摘要:
本申请提供一种语音与图像同步性衡量模型的训练方法及装置,该方法包括:将第一图像片段处理为第一图像数据、第一语音片段处理为第一语音数据、第二语音片段处理为第二语音数据,将随机图像片段处理为第二图像数据、随机语音片段处理为第三语音数据,将第一图像数据和第一语音数据组成正样本,将第一图像数据和第二语音数据组成第一负样本,将第一图像数据和第三语音数据组成第二负样本,将第一语音数据或第二语音数据,和第二图像数据组成第三负样本,采用正样本、第一负样本、第二负样本和第三负样本训练语音与图像同步性衡量模型。这样,使得训练样本的类型更加丰富,能够提高语音与图像同步性衡量模型的精确度。
公开/授权文献
- CN114494930A 语音与图像同步性衡量模型的训练方法及装置 公开/授权日:2022-05-13