-
公开(公告)号:CN112581929B
公开(公告)日:2022-06-03
申请号:CN202011450095.9
申请日:2020-12-11
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10K11/175 , G06N3/04 , G06N3/08
摘要: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。
-
公开(公告)号:CN113921041A
公开(公告)日:2022-01-11
申请号:CN202111183247.8
申请日:2021-10-11
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN113409827A
公开(公告)日:2021-09-17
申请号:CN202110673028.1
申请日:2021-06-17
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/46 , G06K9/00 , G06F16/583 , G06F16/51
摘要: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
公开(公告)号:CN113096673A
公开(公告)日:2021-07-09
申请号:CN202110341574.5
申请日:2021-03-30
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。
-
公开(公告)号:CN113096673B
公开(公告)日:2022-09-30
申请号:CN202110341574.5
申请日:2021-03-30
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。
-
公开(公告)号:CN114649003A
公开(公告)日:2022-06-21
申请号:CN202210268697.5
申请日:2022-03-18
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明属于通信技术领域,提供了基于语音同步和模式转移的多模态加密、解密方法及装置,通过对输入的语音进行语音段检测,采用一段一密的加密方案以此达到更高的加密强度的同时,增强对信道噪声和误码的鲁棒性;采用语音段线谱频率参数平均值作为模态选择的依据,增强模式选择的多样性,同时可以抵抗各种语音压缩传输算法的压缩。
-
公开(公告)号:CN112967739B
公开(公告)日:2022-09-06
申请号:CN202110217938.9
申请日:2021-02-26
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本公开提出了一种基于长短期记忆网络的语音端点检测方法及系统,包括:从语音数据中针对每一语音帧提取多分辨率耳蜗图特征,在一定范围内选取其数个上下文帧,将这些上下文帧按照时间顺序生成输入数据;将输入数据输入到训练后的注意力增强型长短期记忆网络中,生成局部增强的上下文帧语境信息;将局部增强后的数据输入到多头注意力层,生成全面增加权重的上下文帧信息;将全面增加权重的数据输入到神经网络(分类器)中,进行语音端点检测并生成预测结果。在编码器中使用一个注意力增强型LSTM网络,不但解决了多头注意力的位置模糊问题,同时利用数个历史时刻的状态信息,增强记忆的长、短期效果,比单一的LSTM更能突出重要的某几帧的效果。
-
公开(公告)号:CN112967739A
公开(公告)日:2021-06-15
申请号:CN202110217938.9
申请日:2021-02-26
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本公开提出了一种基于长短期记忆网络的语音端点检测方法及系统,包括:从语音数据中针对每一语音帧提取多分辨率耳蜗图特征,在一定范围内选取其数个上下文帧,将这些上下文帧按照时间顺序生成输入数据;将输入数据输入到训练后的注意力增强型长短期记忆网络中,生成局部增强的上下文帧语境信息;将局部增强后的数据输入到多头注意力层,生成全面增加权重的上下文帧信息;将全面增加权重的数据输入到神经网络(分类器)中,进行语音端点检测并生成预测结果。在编码器中使用一个注意力增强型LSTM网络,不但解决了多头注意力的位置模糊问题,同时利用数个历史时刻的状态信息,增强记忆的长、短期效果,比单一的LSTM更能突出重要的某几帧的效果。
-
公开(公告)号:CN113409827B
公开(公告)日:2022-06-17
申请号:CN202110673028.1
申请日:2021-06-17
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/00 , G06F16/583 , G06F16/51
摘要: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
公开(公告)号:CN113921041B
公开(公告)日:2024-10-29
申请号:CN202111183247.8
申请日:2021-10-11
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10L25/51 , G10L25/30 , G10L25/18 , G06F18/213 , G06F18/2415 , G06N3/0464 , G06N3/08
摘要: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
-
-
-
-
-
-
-
-