-
公开(公告)号:CN117195068B
公开(公告)日:2024-06-25
申请号:CN202311111186.3
申请日:2023-08-30
Applicant: 哈尔滨工业大学
IPC: G06F18/241 , G06F18/2415
Abstract: 基于时空关联算法的PIND检测信号分类判识系统,属于航天科学技术中多余物检测信号检测识别领域。为了解决现有的PIND检测信号分类方法存在准确率低、效率低的问题,本发明首先对将波形信号进行分窗并基于脉冲信号得到脉冲位置,根据脉冲信号确定其是否为线上脉冲或线下脉冲,然后确定每个脉冲对应的关联视界和干扰视界范围并计算每一个脉冲的关联脉冲数量、线下关联脉冲数量、线上关联脉冲数量和干扰脉冲数量、线下干扰脉冲数量、线上干扰脉冲数量,然后进行时空连续组搜索并将时空连续组内关联脉冲数的最大值作为时空连续组内的每一个脉冲的关联脉冲数,最后基于关联脉冲和干扰脉冲以及判识规则,判定各脉冲其是组件脉冲还是多余物脉冲。
-
公开(公告)号:CN113362854B
公开(公告)日:2022-11-15
申请号:CN202110619344.0
申请日:2021-06-03
Applicant: 哈尔滨工业大学
Abstract: 基于稀疏自注意力机制的声学事件检测方法、系统、存储介质及设备,属于机器的听觉智能领域。为了解决现有的时序特征提取网络存在无法实现有效的时序建模的问题,从而限制了现有声学事件检测系统的性能。本发明首先对输入音频信号提取梅尔声谱图,然后分别输入到卷积神经网络提取局部特征,并利用基于稀疏自注意力机制的TransformerEncoder提取时域特征;最后输入到全连接层进行分类,并对结果进行后处理,结果输出每个被检测到的声学事件的类别及起止时间。主要用于声学事件的检测。
-
公开(公告)号:CN113362854A
公开(公告)日:2021-09-07
申请号:CN202110619344.0
申请日:2021-06-03
Applicant: 哈尔滨工业大学
Abstract: 基于稀疏自注意力机制的声学事件检测方法、系统、存储介质及设备,属于机器的听觉智能领域。为了解决现有的时序特征提取网络存在无法实现有效的时序建模的问题,从而限制了现有声学事件检测系统的性能。本发明首先对输入音频信号提取梅尔声谱图,然后分别输入到卷积神经网络提取局部特征,并利用基于稀疏自注意力机制的TransformerEncoder提取时域特征;最后输入到全连接层进行分类,并对结果进行后处理,结果输出每个被检测到的声学事件的类别及起止时间。主要用于声学事件的检测。
-
公开(公告)号:CN110164418B
公开(公告)日:2021-08-27
申请号:CN201910621276.4
申请日:2019-07-10
Applicant: 哈尔滨工业大学
Abstract: 基于卷积网格长短时记忆递归神经网络的自动语音识别加速方法,属于语音信号处理技术领域。本发明是为了解决目前的加速方法大多是在牺牲识别性能的条件下进行加速导致其不能满足实际任务的需要问题。本发明的方法针对频谱或者频谱的多通道频谱子带进行时频块切分,然后进行局部特征提取,将卷积神经网络与Grid‑LSTM相结合,弥补了Grid‑LSTM在大频域步长情况下的精度损失。主要用于自动语音识别。
-
公开(公告)号:CN110176250B
公开(公告)日:2021-05-07
申请号:CN201910464699.X
申请日:2019-05-30
Applicant: 哈尔滨工业大学
Abstract: 本发明提供一种基于局部学习的鲁棒声学场景识别方法,属于声音信号处理技术领域。本发明首先采集不同声学场景声音信号,进行频域特征提取;并对提取的特征数据预处理;然后对归一化后的数据进行均值平移、使用mixup方法进行数据扩充;再根据局部学习思想建立卷积神经网络模型,将经过数据扩充后的训练样本集输入该模型进行训练,得到训练好的模型;最后对待识别样本,依次进行频域特征提取、数据预处理,输入到所述训练好的模型中进行识别,得到声学场景识别结果。本发明解决了音频信道不匹配以及不同信道样本数目不平衡的情况下,声学场景识别准确度不高的问题。本发明可适用于信道多样且不同信道样本数目不平衡的声学场景识别。
-
公开(公告)号:CN110148428B
公开(公告)日:2021-04-02
申请号:CN201910447562.3
申请日:2019-05-27
Applicant: 哈尔滨工业大学
Abstract: 一种基于子空间表示学习的声学事件识别方法,涉及声音信号处理技术领域,为解决现有技术在AER任务中,语义特征提取时不能兼顾原始信号本质内容和时序结构的问题,包括:步骤1、信号预处理,步骤2、帧级特征提取,步骤3、子声学事件特征提取,步骤4、子声学事件特征的时序扩展,步骤5、子声学事件特征间的整体语义特征提取,步骤6、声学事件的识别,本发明提取语义特征时,能够兼顾原始信号的整体内容信息和全局时序结构。
-
公开(公告)号:CN110335594A
公开(公告)日:2019-10-15
申请号:CN201910625555.8
申请日:2019-07-11
Applicant: 哈尔滨工业大学
Abstract: 本发明提供基于多示例学习的自动语音识别困难样本挖掘方法,属于语音信号处理技术领域。本发明首先收集语料数据建立数据集、选取训练数据;然后对训练集进行人工标注;使用标注好的训练集建立困难样本检测模型,并对其进行训练;再用训练好的困难样本检测模型在剩余集合上挖掘候选困难样本;最后进行困难样本筛选与标注:对检测到的候选困难样本进行人工确认,同时将人工确认后的困难样本进行标注。本发明解决了现有自动语音识别技术需要人工标注大量数据集的问题。本发明可用于语音识别系统对新领域的快速自适应。
-
公开(公告)号:CN110136741A
公开(公告)日:2019-08-16
申请号:CN201910411692.1
申请日:2019-05-16
Applicant: 哈尔滨工业大学
IPC: G10L21/0264 , G10L25/30
Abstract: 一种基于多尺度上下文的单通道语音增强方法,本发明涉及单通道语音增强方法。本发明是为了解决现有单通道语音增强中,带噪相位与增强频谱不匹配、语音特征和语音增强任务不匹配、以及未有效考虑语音中多尺度上下文信息的问题。过程为:步骤一、对语音进行标准化;步骤二、计算全卷积网络第一层语音特征;步骤三、计算全卷积网络第l层语音特征,l取整数;步骤四、综合多层语音特征,构成多尺度语音特征;步骤五、根据多尺度语音特征,预测纯净语音波形。本发明用于语音增强领域。
-
-
-
-
-
-
-