专利检索 ap:("武汉大晟极科技有限公司") AND inv:"郑攀" 第 1 页

1.

发明公开
一种基于人脸唇动语音分离的声纹识别方法及装置审中-实审

公开(公告)号：CN117877482A

公开(公告)日：2024-04-12

申请号：CN202311827401.X

申请日：2023-12-26

申请人： 武汉大晟极科技有限公司

发明人： 吕江涛 , 王征华 , 郑攀 , 张华军 , 汤申亮 , 邓小涛 , 周靖轩

IPC分类号： G10L15/25 , G10L15/18 , G10L15/06 , G10L17/04

摘要： 本发明涉及一种基于人脸唇动语音分离的声纹识别方法及装置，该方法包括：构造语音分离网络，所述语音分离网络包括面部属性分析网络、唇动分析网络和音频处理网络；基于所述语音分离网络从待检测视频中提取目标语音；基于声纹识别模型对所述目标语音进行声纹识别；其中，所述面部属性分析网络提取面部属性特征，所述唇动分析网络用于提取嘴唇运动特征，所述音频处理网络用于进行语音分离，所述声纹识别模型是基于注册语音训练得到的。本发明实现了多人说话场景下的单通道语音分离，提高了语音分离的灵活性。