-
公开(公告)号:CN116206625A
公开(公告)日:2023-06-02
申请号:CN202211673797.2
申请日:2022-12-26
Applicant: 郑州信大先进技术研究院
Abstract: 本发明提供了一种基于频谱与时间信息结合的自监督异常声音检测方法,包括以下步骤:预先收集各个目标设备的原始音频片段,并以机器ID作为标识进行关联存储,利用预置的梅尔滤波器,提取原始音频片段的梅尔频谱图;通过预置的时间特征提取网络,提取原始音频片段的时间频谱特征图;分别对各台目标设备的梅尔频谱图及时间频谱特征图进行特征融合;将每台目标设备的梅尔与时间融合特征输入分类器中,以每台目标设备的机器ID作为类别标签,进行训练,得到目标分类模型;在测试时,将待测声音信息输入得到的目标分类模型中,得到每台目标设备的实时特征声音指标,根据实时特征声音指标与临界值的比较结果,判断目标设备是否处于异常状态。
-
公开(公告)号:CN117953363A
公开(公告)日:2024-04-30
申请号:CN202311101768.3
申请日:2023-08-30
Applicant: 郑州信大先进技术研究院
IPC: G06V20/10 , G06V10/40 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明涉及一种基于多类别标签辅助的遥感图像描述方法,将采集的遥感图像输入到基于多类别标签辅助的遥感图像描述模型中,最终输出遥感图像的描述信息。其中,遥感图像描述模型包括编码器模块、辅助多标签分类模块、LSTM解码器模块;所述编码器模块,采用在ImageNet预训练过的Resnet50,用于对输入的预处理去重后的遥感图像提取图像全文特征;所述辅助多标签分类模块,用于将输入的图像全文特征经过SoftMax进行多分类判定后,获得预测的显著目标类别;所述LSTM解码器模块,用于在学习到所输入的信息中的图像特征与句法特征之间的映射关系后,输出图像描述信息。
-
公开(公告)号:CN117612084A
公开(公告)日:2024-02-27
申请号:CN202311457268.3
申请日:2023-11-03
Applicant: 郑州信大先进技术研究院
IPC: G06V20/52 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种轻量级烟火实时识别方法及装置,识别方法包括:步骤1,构建轻量级烟火实时识别模型:(1)构建Ghost模块;(2)构建Ghost_BottleNeck模块;(3)构建Ghost_ResNet50结构;步骤2,训练已构建的轻量级烟火实时识别模型;步骤3,采用已训练的轻量级烟火实时识别模型进行烟火实时识别。本发明提出的轻量化烟火识别模型Ghost_ResNet50具有较强的鲁棒性,而且不受限与环境与地点限制,适用于室内监控领域,户外监控以及山林监控领域,在工业界进一步轻量化了模型的参数和计算量,进一步提升了烟火识别的准确率,并且实时性很强,具有较高的嵌入式商业应用价值。
-
-