- 专利标题: 直播的音频纠错方法、装置、计算设备及存储介质
-
申请号: CN202111199865.1申请日: 2021-10-14
-
公开(公告)号: CN113938708B公开(公告)日: 2024-04-09
- 发明人: 李宗祥
- 申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
- 申请人地址: 北京市西城区德胜门外大街11号5幢400室(德胜园区);
- 专利权人: 咪咕文化科技有限公司,中国移动通信集团有限公司
- 当前专利权人: 咪咕文化科技有限公司,中国移动通信集团有限公司
- 当前专利权人地址: 北京市西城区德胜门外大街11号5幢400室(德胜园区);
- 代理机构: 北京市浩天知识产权代理事务所
- 代理商 梁倩
- 主分类号: H04N21/233
- IPC分类号: H04N21/233 ; H04N21/439 ; G10L15/22 ; G10L15/26 ; G10L17/02 ; G10L17/06
摘要:
本发明公开了一种直播的音频纠错方法、装置、计算设备及存储介质,该方法包括:接收直播端发送的直播音频数据,提取直播音频数据的声纹特征;判断直播音频数据的声纹特征与混淆声纹特征是否匹配;其中,混淆声纹特征通过对混淆音频数据进行声纹特征抽取处理得到,混淆音频数据通过对表征知识实体之间的错误关系的混淆文本进行语音克隆处理得到;若是,获取混淆声纹特征对应的修正音频数据,将直播音频数据替换为修正音频数据。通过上述方式,能够识别出直播中表述错误的音频,将表述错误的音频替换为修正音频,能够实时地对直播音频进行纠错。
公开/授权文献
- CN113938708A 直播的音频纠错方法、装置、计算设备及存储介质 公开/授权日:2022-01-14