-
公开(公告)号:CN113921041B
公开(公告)日:2024-10-29
申请号:CN202111183247.8
申请日:2021-10-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G06F18/213 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN115019833B
公开(公告)日:2024-09-17
申请号:CN202210852485.1
申请日:2022-07-20
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间(频率)维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
-
公开(公告)号:CN115565538A
公开(公告)日:2023-01-03
申请号:CN202211119112.X
申请日:2022-09-13
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明公开了基于单分类多尺度残差网络的语音鉴伪方法及系统;其中所述方法,包括:获取待鉴别的语音数据;对语音数据进行分帧加窗处理;对分帧加窗处理后的语音数据进行特征提取操作;将提取的特征输入到训练后的多尺度残差神经网络模型中,生成置信度分数,根据置信度分数确定待鉴别的语音数据是真实语音还是伪造语音;其中,训练后的多尺度残差神经网络模型,使用单分类Softmax损失函数进行训练,学习一个特征空间,压缩真实语音表示并注入角度余量以分离嵌入空间中的伪造语音。
-
公开(公告)号:CN113160844A
公开(公告)日:2021-07-23
申请号:CN202110459982.0
申请日:2021-04-27
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了基于噪声背景分类的语音增强方法及系统,包括:获取待处理语音信号;对待处理语音信号进行特征提取;将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;根据噪声背景标签,选择对应标签的训练后的生成器;将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。本方法选择了提取带噪语音的梅尔频率倒谱系数输入分类器对噪声背景进行分类,对分类好的语音使用同一个模型内针对此类噪声背景的生成对抗网络来实现语音增强,此方法在面对多场景下的语音增强都有较好的效果。
-
公开(公告)号:CN112581929A
公开(公告)日:2021-03-30
申请号:CN202011450095.9
申请日:2020-12-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G06N3/04 , G06N3/08
Abstract: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。
-
公开(公告)号:CN108461088B
公开(公告)日:2019-11-19
申请号:CN201810232462.4
申请日:2018-03-21
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/16 , G10L19/04 , G10L25/93 , G10L19/08 , G10L19/087
Abstract: 本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。
-
公开(公告)号:CN109616143A
公开(公告)日:2019-04-12
申请号:CN201811526264.5
申请日:2018-12-13
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87
Abstract: 本发明公开了一种基于变分模态分解和感知哈希的语音端点检测方法,该方法包括:接收输入语音信号;将输入语音信号进行VMD分解,将VMD分解后的固有模态函数分别进行短时时频分析,得到时频分析矩阵,根据感知哈希算法计算时频分析矩阵的感知哈希值;将输入语音信号VMD分解后时频分析矩阵的感知哈希值与环境噪声VMD分解后时频分析矩阵的感知哈希值进行比较,判断输入语音信号的语音段和噪声段。
-
公开(公告)号:CN205336318U
公开(公告)日:2016-06-22
申请号:CN201521050793.4
申请日:2015-12-16
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本实用新型的水声语音通信终端,包括麦克、耳机、声码器模块、调制解调模块和发射接收模块;声码器模块由音频CODEC、声码编模块和声码解码模块组成,调制解调模块由调制模块、解调模块、D/A、A/D构成,发射接收模块由水声换能器、功率放大器和测量放大器组成;声码编码模块、调制模块分别实现语音发射过程中数字语音的编码、调制作用,解调模块、声码解码模块分别实现语音接收过程中数字语音的解调、解码作用。本实用新型的水声语音通信终端,在语音信号的编码和解码过程中,可将语音信号编码成不同的速率进行发送,以适应复杂多变的水声信道环境,保证水下语音通信的正常进行,具有电路简单,功耗低、可靠性高、成本低等特点。
-
公开(公告)号:CN206849492U
公开(公告)日:2018-01-05
申请号:CN201720756820.2
申请日:2017-06-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G01S5/22
Abstract: 本实用新型的基于声源定位的声掩蔽系统,包括语音采集电路、中央处理单元、噪声发生模块、运放电路、幅度可调电路、功放电路和终端;语音采集电路由多路MIC组成,MIC的输出依次经放大电路、A/D转换器的处理后输入至ARM处理器中,幅度可调电路的输出经功放电路的放大后驱使终端进行空气声和/或振动声的转换;ARM处理器经控制总线接口与幅度可调电路相连接,以调整输出的噪声干扰信号的幅度。本实用新型应用在保密会议室的声掩蔽系统中,能够从根本上优化声掩蔽系统的防护效果,以最小的噪声干扰获取最佳的防窃听效果,从根本上对声掩蔽系统的防护效果和干扰效果进行了优化,一定程度上减少掩蔽声的噪声污染。(ESM)同样的发明创造已同日申请发明专利
-
公开(公告)号:CN204518083U
公开(公告)日:2015-07-29
申请号:CN201520132078.9
申请日:2015-03-09
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本实用新型的多音箱故障检测系统,特征在于:包括差分放大电路、第二级运放电路、电压比较器和故障报警电路,差分放大电路的两信号端串联于多音箱的音频回路中,整流滤波电路对第二级运放电路输出的信号整流、滤波后,输入至电压比较器的同相输入端,电压比较器的反相输入端经电位器接于电源上;通过调节电压比较器反相输入端上的电位器,使故障报警电路恰好不发生报警;当有音箱发生故障而断路时,会使输入至差分放大电路中的差分信号减小,而得电压比较器的输出电平发生翻转而触发报警。本系统电路简单,成本低廉,安装方便,只需要将此装置串联接入音箱即可工作。可安装到总控制室,也可以安装到每个音箱上,可以实时检测是否有音箱损。
-
-
-
-
-
-
-
-
-