-
公开(公告)号:CN113921041A
公开(公告)日:2022-01-11
申请号:CN202111183247.8
申请日:2021-10-11
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN113409827A
公开(公告)日:2021-09-17
申请号:CN202110673028.1
申请日:2021-06-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/46 , G06K9/00 , G06F16/583 , G06F16/51
Abstract: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
公开(公告)号:CN113096673A
公开(公告)日:2021-07-09
申请号:CN202110341574.5
申请日:2021-03-30
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。
-
公开(公告)号:CN109346093B
公开(公告)日:2019-09-03
申请号:CN201811541115.6
申请日:2018-12-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/16 , G10L19/032 , G10L25/93
Abstract: 本公开公开了一种低速率声码器子带清浊音参数提取与量化的融合方法,该方法充分考虑了子带清浊音参数的统计和量化特性,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。可以有效用于2400bps以下的低速率、超低速率语音编码算法中,实现减少低速率声码器算法复杂度、降低系统功耗的目的。
-
公开(公告)号:CN104637485A
公开(公告)日:2015-05-20
申请号:CN201510094030.8
申请日:2015-03-03
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/018
CPC classification number: G10K11/175 , G10L19/018
Abstract: 本发明的用于保护汉语语音私密度的掩蔽信号的生成方包括a).统计语句概率表;b).统计句段概率表;c).统计词组概率表;d).统计汉字概率表;e).统计音节概率表;f).按照确定自然段的语句数、语句中的句段数、句段中的词组数、词组中的汉字数、汉字的音节生成文本信息;g).语音合成。本发明的掩蔽信号的生成方法,充分考虑了会议室声音掩蔽的需求及汉语语音的特点,摒弃了采用稳态噪声等掩蔽信号的传统方式,基于汉语语言中字、词、句的各项统计特性,利用人类发声语音库,生成一种无实际意义的、与正常说话语音极其相似的掩蔽信号。这种掩蔽信号相比传统的掩蔽噪声,大大减弱了听觉上的各种负面影响,提高了声音掩蔽效果。
-
公开(公告)号:CN107154256B
公开(公告)日:2023-11-24
申请号:CN201710503021.9
申请日:2017-06-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G01S5/22
Abstract: 本发明的基于声源定位的声掩蔽系统,包括语音采集电路、中央处理单元、噪声发生模块、运放电路、幅度可调电路、功放电路和终端;语音采集电路由多路MIC组成,ARM处理器经控制总线接口与幅度可调电路相连接,以调整输出的噪声干扰信号的幅度。本发明的自适应调整方法,首先确定出声源的坐标,再根据终端与声源的距离计算出每个终端处的声压强度,再根据防护信噪比确定每个终端应输出的干扰噪声的强度。本发明应用在保密会议室的声掩蔽系统中,能够从根本上优化声掩蔽系统的防护效果,以最小的噪声干扰获取最佳的防窃听效果,从根本上对声掩蔽系统的防护效果和干扰效果进行了优化,一定程度
-
公开(公告)号:CN115171710A
公开(公告)日:2022-10-11
申请号:CN202210799728.X
申请日:2022-07-08
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G10L21/007 , G10L21/0224 , G10L21/0232 , G10L19/02 , G10L25/63 , G06N3/08 , G06N3/04
Abstract: 本发明属于语音信号处理的语音增强技术领域,提供了一种基于多角度判别的生成对抗网络的语音增强方法及系统。该方法包括,获取带噪声语音信号;基于带噪声语音信号,采用训练好的生成对抗网络,得到增强后的语音信号;其中,所述生成对抗网络包括一个生成器和四个判别器。本发明的多角度判别包括:增强后语音信号、干净语音与情绪语音之间的差异;同时添加从频域判别学习增强后语音信号、干净语音与情绪语音之间的频域差异。本发明从不同语音信号的语音成分进行判别,以及语音的时域频域角度,能够从不同角度充分学习语音成分,为生成器提供足够多的反馈信息,可以有效改善语音失真,提高增强后语音的语音质量。
-
公开(公告)号:CN113096673B
公开(公告)日:2022-09-30
申请号:CN202110341574.5
申请日:2021-03-30
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。
-
公开(公告)号:CN115019833A
公开(公告)日:2022-09-06
申请号:CN202210852485.1
申请日:2022-07-20
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间(频率)维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
-
公开(公告)号:CN114649003A
公开(公告)日:2022-06-21
申请号:CN202210268697.5
申请日:2022-03-18
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于通信技术领域,提供了基于语音同步和模式转移的多模态加密、解密方法及装置,通过对输入的语音进行语音段检测,采用一段一密的加密方案以此达到更高的加密强度的同时,增强对信道噪声和误码的鲁棒性;采用语音段线谱频率参数平均值作为模态选择的依据,增强模式选择的多样性,同时可以抵抗各种语音压缩传输算法的压缩。
-
-
-
-
-
-
-
-
-