基于生成对抗网络的语音处理方法及系统

    公开(公告)号:CN113096673A

    公开(公告)日:2021-07-09

    申请号:CN202110341574.5

    申请日:2021-03-30

    Abstract: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。

    一种用于保护汉语语音私密度的掩蔽信号的生成方法

    公开(公告)号:CN104637485A

    公开(公告)日:2015-05-20

    申请号:CN201510094030.8

    申请日:2015-03-03

    CPC classification number: G10K11/175 G10L19/018

    Abstract: 本发明的用于保护汉语语音私密度的掩蔽信号的生成方包括a).统计语句概率表;b).统计句段概率表;c).统计词组概率表;d).统计汉字概率表;e).统计音节概率表;f).按照确定自然段的语句数、语句中的句段数、句段中的词组数、词组中的汉字数、汉字的音节生成文本信息;g).语音合成。本发明的掩蔽信号的生成方法,充分考虑了会议室声音掩蔽的需求及汉语语音的特点,摒弃了采用稳态噪声等掩蔽信号的传统方式,基于汉语语言中字、词、句的各项统计特性,利用人类发声语音库,生成一种无实际意义的、与正常说话语音极其相似的掩蔽信号。这种掩蔽信号相比传统的掩蔽噪声,大大减弱了听觉上的各种负面影响,提高了声音掩蔽效果。

    基于声源定位的声掩蔽系统及自适应调整方法

    公开(公告)号:CN107154256B

    公开(公告)日:2023-11-24

    申请号:CN201710503021.9

    申请日:2017-06-27

    Abstract: 本发明的基于声源定位的声掩蔽系统,包括语音采集电路、中央处理单元、噪声发生模块、运放电路、幅度可调电路、功放电路和终端;语音采集电路由多路MIC组成,ARM处理器经控制总线接口与幅度可调电路相连接,以调整输出的噪声干扰信号的幅度。本发明的自适应调整方法,首先确定出声源的坐标,再根据终端与声源的距离计算出每个终端处的声压强度,再根据防护信噪比确定每个终端应输出的干扰噪声的强度。本发明应用在保密会议室的声掩蔽系统中,能够从根本上优化声掩蔽系统的防护效果,以最小的噪声干扰获取最佳的防窃听效果,从根本上对声掩蔽系统的防护效果和干扰效果进行了优化,一定程度

    基于生成对抗网络的语音处理方法及系统

    公开(公告)号:CN113096673B

    公开(公告)日:2022-09-30

    申请号:CN202110341574.5

    申请日:2021-03-30

    Abstract: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。

Patent Agency Ranking