一种基于醉汉模型的轻量化声学场景感知方法

    公开(公告)号:CN117524252A

    公开(公告)日:2024-02-06

    申请号:CN202311505530.7

    申请日:2023-11-13

    Abstract: 本发明公开了一种基于醉汉模型的轻量化声学场景感知方法,包括:常规音频特征提取:常规音频特征通过特征转换模块处理,得到醉汉特征。常规模型训练。使用常规模型进行通道缩减和添加频率分组融合卷积的操作,以得到醉汉模型的初始版本。使用引导模块得到的初始版本的醉汉模型进行训练。使用常规模型作为教师模型,醉汉模型作为学生模型,通过知识蒸馏的方式来提升学生模型的性能。对融合后的轻量化模型进行评估,得到评估结果。根据评估结果,对轻量化模型进行优化和调整。得到最终的醉汉模型。将常规音频特征输入醉汉模型,得到声学场景感知结果。本发明的优点是:减少训练时间和计算资源的消耗,并且能获得较高的准确率和较低的损失值。

    一种基于醉汉模型的轻量化声学场景感知方法

    公开(公告)号:CN117524252B

    公开(公告)日:2024-04-05

    申请号:CN202311505530.7

    申请日:2023-11-13

    Abstract: 本发明公开了一种基于醉汉模型的轻量化声学场景感知方法,包括:常规音频特征提取:常规音频特征通过特征转换模块处理,得到醉汉特征。常规模型训练。使用常规模型进行通道缩减和添加频率分组融合卷积的操作,以得到醉汉模型的初始版本。使用引导模块得到的初始版本的醉汉模型进行训练。使用常规模型作为教师模型,醉汉模型作为学生模型,通过知识蒸馏的方式来提升学生模型的性能。对融合后的轻量化模型进行评估,得到评估结果。根据评估结果,对轻量化模型进行优化和调整。得到最终的醉汉模型。将常规音频特征输入醉汉模型,得到声学场景感知结果。本发明的优点是:减少训练时间和计算资源的消耗,并且能获得较高的准确率和较低的损失值。

    一种声学场景与声音事件联合任务分析方法

    公开(公告)号:CN117935860A

    公开(公告)日:2024-04-26

    申请号:CN202410138072.6

    申请日:2024-01-31

    Abstract: 本发明公开了一种基于多任务学习的声学场景与声音事件联合分析方法,目标是通过加入额外的声音事件信息,重点提升声学场景感知的性能,包括:将Multi‑gate Mixture‑of‑Experts模型引入声学领域,替代传统多任务学习模型,弱化任务间差异带来的固有冲突。在Multi‑gate Mixture‑of‑Experts模型基础上增加两条信息交互分支,提出一种新的模型—Cross_MMoE。将Class‑Balanced Loss代替传统的多任务加权损失,在传统多任务模型、MMoE模型、Cross_MMoE模型进行评估,得到评估结果。本发明的优点是:利用多任务学习策略对声学领域相关联的两个任务进行联合分析,降低了计算和存储成本,大大增加了推理速度,并且提高了声学场景分类的准确率。

    复杂结构建筑的干涉圆周SAR三维成像方法及装置

    公开(公告)号:CN114740477A

    公开(公告)日:2022-07-12

    申请号:CN202210539524.2

    申请日:2022-05-18

    Abstract: 本发明公开了一种复杂结构建筑的干涉圆周SAR三维成像方法及装置,其中方法包括:获得一组天线相位中心对应的子孔径图像组,子孔径图像组是根据每个天线相位中心的子孔径数据在参考高度平面进行成像得到的;对子孔径图像组进行干涉处理,得到缠绕干涉相位;根据缠绕干涉相位,场景高度范围和预先建立的高度差与缠绕干涉相位的关系,确定多个相位模糊数;根据多个相位模糊数,利用距离多普勒方程计算每个子孔径下的多个三维位置;利用相关系数算法从所述每个子孔径下的多个三维位置中进行选取;根据选取的结果进行复杂结构建筑的干涉圆周SAR三维成像。本发明有效减少数据存储量和计算量,提高成像效率。

    一种场景感知与事件分类的多任务声学分析方法

    公开(公告)号:CN117975995A

    公开(公告)日:2024-05-03

    申请号:CN202410148415.7

    申请日:2024-02-02

    Abstract: 本发明公开了一种场景感知与事件分类的多任务声学分析方法,包括:建立多任务网络模型,由SED与ASC两个子网络构成,每个子网络包括频率动态卷积、池化层、注意力机制以及全连接层。并采用了cross‑stitch模块,实现两个子网络之间的软参数共享。在特征提取阶段,本发明采用对数梅尔频谱图作为输入特征。送到各自任务对应的卷积模块进行处理。采用了注意力模块来对音频序列中的全局与局部上下文信息进行建模。每个子任务通过其对应的全连接层生成最终输出。通过对每个任务的输出进行加权平均处理,得到每个任务的最终结果。本发明的优点是:提升了网络的整体性能。提高了场景感知与事件分类的准确性。提高了网络的泛化能力。具有较好的通用性和适用性。

    一种折叠包装盒
    6.
    实用新型

    公开(公告)号:CN204021394U

    公开(公告)日:2014-12-17

    申请号:CN201420329712.3

    申请日:2014-06-20

    Inventor: 王雪莹 陈香 张琳

    Abstract: 一种折叠包装盒,包括盒底,盒壁和盒盖,所述盒底,盒壁,盒盖为一体折叠而成,平铺开为一个整体的平面。本实用新型一体成型,整体强度高,生产成本低,适合批量生产,运输和储存占用空间少且能够重复使用。

Patent Agency Ranking