Patent search ap:("大连海事大学") AND inv:"杜晗" Page 1

1.

发明公开
一种VDR语音端点检测方法审中-实审

公开(公告)号：CN116246664A

公开(公告)日：2023-06-09

申请号：CN202211635844.4

申请日：2022-12-19

Applicant: 大连海事大学

Inventor： 张维维 , 刘鑫 , 杜晗 , 成皓 , 王扬

IPC: G10L25/87 , G10L25/24 , G10L25/30

Abstract: 本发明公开了一种VDR语音端点检测方法，包括：提取音频信号的特征信息，分别获取上述四个特征信息的一阶差分和二阶差分；将零填充后的特征图输入带有注意力机制的残差网络，提取特征图的复杂抽象特征；计算初步输出值为0和1对应的特征质心；搜索语音端点检测初步输出中持续时间为100ms以下的突变，并将其定义为短时突变，计算突变部分特征质心分别与整个音频文件的0和1两类判断结果的特征质心相似度；通过短时突变部分的特征质心相似度估计结果对VDR语音端点检测输出值进行更新，得到最终VDR语音端点检测的输出值。该方法避免短时端点检测突变，进而准确定位出VDR音频信号中语音位置。

2.

发明公开
一种船舶VHF通信音频信号的语音增强方法审中-实审

公开(公告)号：CN117409793A

公开(公告)日：2024-01-16

申请号：CN202311175450.X

申请日：2023-09-12

Applicant: 大连海事大学

Inventor： 张维维 , 杜晗 , 刘振宇

IPC: G10L21/007 , G10L21/0232 , G10L21/0224 , G10L25/30 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08

Abstract: 本发明公开了一种船舶VHF通信音频信号的语音增强方法，包括：将音频信号进行短时傅里叶变换提取其实部和虚部分量；将实部和虚部分量输入至编码器中获得编码输出特征FK，将编码输出特征FK输入到复数Conformer模块中获得全局特征H，将全局特征H进行重塑得到重塑特征H'，重塑特征H'和编码输出特征FK相拼接作为解码器的输入信息获得复数比例掩蔽GK，所述复数比例掩蔽GK为VHF通信音频信号的复数比例掩蔽，基于复数比例掩蔽GK获得增强的语音信号复数谱，对增强的语音信号复数谱作短时傅里叶逆变换得到增强的语音信号。本方法可充分利用时域、频域、绝对误差、相对误差、信号、噪声等信息进行权重更新，获得了更优的网络参数和增强效果。

Patent Agency Ranking