一种基于改进NanoDet深度网络的发动机浓烟淡烟自动检测方法

    公开(公告)号:CN114092458A

    公开(公告)日:2022-02-25

    申请号:CN202111428973.1

    申请日:2021-11-29

    IPC分类号: G06T7/00 G06N3/04 G06N3/08

    摘要: 一种基于改进NanoDet深度网络的发动机浓烟淡烟自动检测方法,采集发动机烟雾图片构成数据集;利用改进NanoDet深度网络,在保证相同感受野的条件下,仅使用C5特征层,减少网络参数;对特征层的每个像素进行边框预测;并使用适应性训练样本选择算法筛选正负样本,检测头由分类分支和边框回归分支以及隐含无监督目标性预测子分支构成,提高检测精度。由网络输出结果判断发动机是否产生烟雾和烟雾的类别。若检测到烟雾则继续根据烟雾区域和背景区域的色度差来判断检测到烟雾的种类,如果产生淡烟,则立即进行报警,防微杜渐,如果检测结果为浓烟则除报警外自动启动应急措施;如果未检测到烟雾,继续进行检测。该方法可实现对汽车和航空发动机浓烟淡烟检测。

    一种多种噪声环境下的语音增强方法

    公开(公告)号:CN116013344A

    公开(公告)日:2023-04-25

    申请号:CN202211637892.7

    申请日:2022-12-17

    IPC分类号: G10L21/0208 G10L25/30

    摘要: 本发明公开了一种多种噪声环境下的语音增强方法,其包括:1)完成音频的预处理与数据增强操作;2)使用基于Transformer架构的多尺度编码器提取多层次音频特征,并借助特征提升模块强化关键的特征;3)借助基于双路架构的长短期感知模块分别实现不同维度上长短期特征的捕获;4)使用残差解码器和掩码估计模块获得纯净语音信号;5)借助均方误差损失项和信噪比损失项联合训练网络模型。此方法的鲁棒性强,实时性高,可以有效地处理鸣笛声、喧嚣声、鼓掌声、鸟鸣声等十种常见的噪声,从而改善短视频、网络直播、视频会议、语音通话等应用的用户体验。与部分主流语音增强模型相比,在相关评价指标上可以平均提升16%。