一种融合全局场景与局部事件信息的音频语意概述方法

    公开(公告)号:CN114155835B

    公开(公告)日:2022-07-08

    申请号:CN202111475701.7

    申请日:2021-12-06

    Abstract: 本发明涉及一种音频语意概述方法,具体为一种融合全局场景与局部事件信息的音频语意概述方法,首先对实际场景中产生的音频进行建模分析,随后从声学场景的宏观全局特性入手,并融合了对于场景内各音频事件的精细化感知,最终生成贴合人类自然语言逻辑的语意概述文本,本发明对于声学场景中局部声音事件的精细化感知为构建音频特征的语意信息与自然语言语意信息的映射提供了细粒度的信息感知方式,能够有效规避传统方法对于音频事件的误识别与内容忽略,有助于构建更高语意层次的人机交互过程;此外,本发明提供了全新的注意力计算机制,相比传统注意力机制降低了计算成本。

    一种利用时频融合补偿异常感知及稳定性的异音检测方法

    公开(公告)号:CN114155879A

    公开(公告)日:2022-03-08

    申请号:CN202111475597.1

    申请日:2021-12-06

    Abstract: 本发明公开的属于异音检测方法技术领域,具体为一种利用时频融合补偿异常感知及稳定性的异音检测方法,借助从声学目标原始音频信号x∈R1*L获取的时域信息和频域信息形成感知互补;时频域融合特征输入深度神经网络,经过网络学习从而获得对于待检测声学目标的状态感知,针对现有异音检测方法所采用的Log‑Mel谱特征对一定声学目标缺乏感知能力的问题,本发明设计了从时域角度构建的可学习特征与Log‑Mel谱相融合,实现了时频域信息互补的双赢增益机制,本发明设计的时频域融合的可学习特征能够有效地提升异音检测系统的稳定性,解决现有工业异音检测方法稳定性不足,检测结果可信度低的问题。

    一种基于SAGAN样本扩充和辅助信息的SAR目标分类方法

    公开(公告)号:CN109934282A

    公开(公告)日:2019-06-25

    申请号:CN201910176375.6

    申请日:2019-03-08

    Abstract: 本发明属于合成孔径雷达小样本目标识别领域,具体涉及一种基于SAGAN样本扩充和辅助信息的SAR目标分类方法。本研究根据SAR的数据样本图像的特性,对Inception结构进行优化和改进,并添加适当的正则化条件,联合上述的GAN小样本生成和GAN小样本超分辨率的成果,对SAR小样本目标进行精确的识别。本发明提出了一种更适用于SAR遥感图像的网络,使得其能够学习不同种类目标区域的特征,从而生成新的较为逼真的目标区域图像,解决了SAR小样本的数据量少的问题。解决了针对合成孔径雷达SAR遥感图像中的目标区域,一种基于自注意力生成对抗网络样本扩充和辅助信息的SAR目标分类方法,本发明主要涉及生成式对抗网络来扩充SAR新样本数据,并基于Restnet50结构网络用以SAR小样本目标识别。

    一种利用元数据生成音频预测未知异常的异音检测方法

    公开(公告)号:CN118053450B

    公开(公告)日:2025-03-07

    申请号:CN202410266452.8

    申请日:2024-03-08

    Abstract: 本发明为一种利用元数据生成音频预测未知异常的异音检测方法,解决了目标机器异常音频样本对现有异音检测模型不可见导致异音检测模型无法选择超参数,异音检测系统性能受限的问题。本发明提供的异常样本预测策略借助音频特征和元数据信息特征对齐构建基于元数据信息的音频生成方法,进而预测未知的目标机器类型异常声音特性,为现有异常声音检测方法在First‑Shot场景下生成了可用于模型训练的目标机器预测声音样本,借助于预测声音样本,异音检测方法能在复杂的异常声音检测现实场景中确定最优模型,提升异音检测方法的性能和通用性。同时,本发明构建的统一的样本生成模型,缓解了现实场景中异常样本稀缺问题,有效降低了异音检测方法的工业化部署难度。

    一种基于音频时序信息加权的频域特征表示异音检测方法

    公开(公告)号:CN116230015B

    公开(公告)日:2023-08-08

    申请号:CN202310240262.4

    申请日:2023-03-14

    Abstract: 本发明提出一种基于音频时序信息加权的频域特征表示异音检测方法,能够有效区分正常信息和异常信息,提升异常声音检测的稳定性和对不同机器的适应性。本发明通过对原始音频信号获取Log‑Mel谱频域特征,并在时间维度上对其应用全局加权排序池化,得到音频信号的基于音频时序信息加权的频域特征表示,解决了对稳定音频信号和非稳定音频信号的平衡问题。并基于音频时序信息加权的频域特征表示,针对不同机器类型,根据最佳检测性能,找到全局加权排序池化最合适的池化参数,实现用于异常声音检测的更鲁棒性的音频特征表示。

    一种基于音频时序信息加权的频域特征表示异音检测方法

    公开(公告)号:CN116230015A

    公开(公告)日:2023-06-06

    申请号:CN202310240262.4

    申请日:2023-03-14

    Abstract: 本发明提出一种基于音频时序信息加权的频域特征表示异音检测方法,能够有效区分正常信息和异常信息,提升异常声音检测的稳定性和对不同机器的适应性。本发明通过对原始音频信号获取Log‑Mel谱频域特征,并在时间维度上对其应用全局加权排序池化,得到音频信号的基于音频时序信息加权的频域特征表示,解决了对稳定音频信号和非稳定音频信号的平衡问题。并基于音频时序信息加权的频域特征表示,针对不同机器类型,根据最佳检测性能,找到全局加权排序池化最合适的池化参数,实现用于异常声音检测的更鲁棒性的音频特征表示。

Patent Agency Ranking