-
公开(公告)号:CN114051195A
公开(公告)日:2022-02-15
申请号:CN202111401801.5
申请日:2021-11-19
Applicant: 北方工业大学
IPC: H04R3/00
Abstract: 本发明公开了一种远近场自适应拾音器,包括:麦克风组,用于采集声音信号;所述麦克风组包括用于采集近场声音信号的近场麦克风和用于采集远场声音信号的远场麦克风;调理模块,与所述麦克风组连接,用于对所述声音信号进行放大处理;处理模块,与所述调理模块连接,用于对放大后的声音信号进行幅度比较、逻辑处理以及混音处理;输出驱动模块,与所述处理模块连接,用于对处理后的信号进行输出。本发明利用远场和近场的阵列技术及电路多阈值自适应技术,实现了远近场的语音信息融合,降低了设计复杂度,便于部署,具有更加强大的适应能力。
-
公开(公告)号:CN113109764A
公开(公告)日:2021-07-13
申请号:CN202110405303.1
申请日:2021-04-15
Applicant: 北方工业大学
IPC: G01S5/22
Abstract: 本发明涉及一种声源定位方法及系统,方法包括:获取麦克风阵列各麦克风的输入声音信号;根据各所述麦克风的输入声音信号计算声源信号到达所述麦克风的时间差;根据所述声源信号到达所述麦克风的时间差计算声源在粗定位空间中的粗定位位置;根据各所述麦克风的输入声音信号以及所述粗定位位置计算声源在细定位空间中的细定位位置;所述粗定位空间以及所述细定位空间均为以所述麦克风阵列为球心,由多个离散点组成的球形空间,所述离散点为所述球形空间的顶点,所述粗定位空间中离散点的数量小于所述细定位空间中离散点的数量。本发明使用粗定位空间快速搜索到声源所在区域后,再利用细定位空间搜索得到声源的精确位置,声源定位精度极高。
-
公开(公告)号:CN117935860A
公开(公告)日:2024-04-26
申请号:CN202410138072.6
申请日:2024-01-31
Applicant: 北方工业大学
Abstract: 本发明公开了一种基于多任务学习的声学场景与声音事件联合分析方法,目标是通过加入额外的声音事件信息,重点提升声学场景感知的性能,包括:将Multi‑gate Mixture‑of‑Experts模型引入声学领域,替代传统多任务学习模型,弱化任务间差异带来的固有冲突。在Multi‑gate Mixture‑of‑Experts模型基础上增加两条信息交互分支,提出一种新的模型—Cross_MMoE。将Class‑Balanced Loss代替传统的多任务加权损失,在传统多任务模型、MMoE模型、Cross_MMoE模型进行评估,得到评估结果。本发明的优点是:利用多任务学习策略对声学领域相关联的两个任务进行联合分析,降低了计算和存储成本,大大增加了推理速度,并且提高了声学场景分类的准确率。
-
公开(公告)号:CN106067022A
公开(公告)日:2016-11-02
申请号:CN201610366241.7
申请日:2016-05-28
Applicant: 北方工业大学
CPC classification number: G06K9/3241 , G06K9/6256
Abstract: 一种基于DPM算法的遥感图像靠港船舶检测虚警剔除方法,针对光学遥感图像中港口内船舶目标,结合已有的基于形态特征候选区域检测算法,构建一种高效的靠港船舶目标的虚警剔除方法。首先离线建立船舶目标训练数据库,训练并初始化船舶模型;并通过HOG算法构建特征图像金字塔;之后在特征金字塔l层分辨率图像上计算根模型响应得分;找到与l层特征图像相对应的两倍分辨率特征图像,在此图像上计算得到部件模型的响应得分,并对高分区域进行拓展;最后根据根模型与部件模型的得分,得到特征图像金字塔每层的综合得分,通过迭代循环优化得到候选区图像上船舶目标的位置。
-
公开(公告)号:CN105279130A
公开(公告)日:2016-01-27
申请号:CN201510696967.2
申请日:2015-10-22
Applicant: 北方工业大学
CPC classification number: G06F13/4291 , G06F13/4022 , G06F2213/0016
Abstract: 本发明公开了一种对同地址的I2C器件进行操作的方法。本发明中首先需要实现一种总线接口模块。该模块将I2C的时钟SCL进行一对多的扩展,将I2C的数据信号SDA进行了一对一的驱动扩展。其次,在I2C的协议基础上,增加了全局模式的I2C控制和单点模式的I2C操作的协议。全局操作可同时对所有的I2C实现操作,包括其起始、停止及写操作,而单独的I2C操作的支持对指定I2C器件的起始、停止及读写操作。本发明特别适合于需要对多个相同I2C地址的设备同时发命令,然后顺序读取I2C器件的返回值的I2C操作模式,如传感器的同时数据采集。
-
公开(公告)号:CN118536848B
公开(公告)日:2025-02-25
申请号:CN202410247968.8
申请日:2024-03-05
Applicant: 北方工业大学
IPC: G06Q10/0639 , G06Q50/10 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于多模态融合的公共场合服务质量评价方法及系统,涉及多模态融合技术领域,所述服务质量评价方法包括获取服务窗口环境中的声音信息以及客户和服务人员对接的语音信息;对声音信息进行处理,得到所述声音信息中存在的声音事件;对语音信息进行处理,得到语音信息中与服务质量有关的词语和文本信息中与服务质量有关的词语;所述文本信息是所述语音信息进行文本转换后得到的信息;将声音信息中存在的声音事件、处理后的语音信息中与服务质量有关的词语和文本信息中与服务质量有关的词语进行融合,得到服务质量等级。本发明将声音信息、语音信息及文本信息三者进行融合对服务质量进行评价,实现了服务质量评价的全面性和客观性。
-
公开(公告)号:CN118536848A
公开(公告)日:2024-08-23
申请号:CN202410247968.8
申请日:2024-03-05
Applicant: 北方工业大学
IPC: G06Q10/0639 , G06Q50/10 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于多模态融合的公共场合服务质量评价方法及系统,涉及多模态融合技术领域,所述服务质量评价方法包括获取服务窗口环境中的声音信息以及客户和服务人员对接的语音信息;对声音信息进行处理,得到所述声音信息中存在的声音事件;对语音信息进行处理,得到语音信息中与服务质量有关的词语和文本信息中与服务质量有关的词语;所述文本信息是所述语音信息进行文本转换后得到的信息;将声音信息中存在的声音事件、处理后的语音信息中与服务质量有关的词语和文本信息中与服务质量有关的词语进行融合,得到服务质量等级。本发明将声音信息、语音信息及文本信息三者进行融合对服务质量进行评价,实现了服务质量评价的全面性和客观性。
-
公开(公告)号:CN117975995A
公开(公告)日:2024-05-03
申请号:CN202410148415.7
申请日:2024-02-02
Applicant: 北方工业大学
Abstract: 本发明公开了一种场景感知与事件分类的多任务声学分析方法,包括:建立多任务网络模型,由SED与ASC两个子网络构成,每个子网络包括频率动态卷积、池化层、注意力机制以及全连接层。并采用了cross‑stitch模块,实现两个子网络之间的软参数共享。在特征提取阶段,本发明采用对数梅尔频谱图作为输入特征。送到各自任务对应的卷积模块进行处理。采用了注意力模块来对音频序列中的全局与局部上下文信息进行建模。每个子任务通过其对应的全连接层生成最终输出。通过对每个任务的输出进行加权平均处理,得到每个任务的最终结果。本发明的优点是:提升了网络的整体性能。提高了场景感知与事件分类的准确性。提高了网络的泛化能力。具有较好的通用性和适用性。
-
公开(公告)号:CN111366692A
公开(公告)日:2020-07-03
申请号:CN202010298107.4
申请日:2020-04-16
Applicant: 北方工业大学
Abstract: 本发明公开了一种气体环境参数监测系统及方法,其中系统包括:气体采集单元,浓度预测单元和参数调整单元;所述气体采集单元包括:气泵和传感器,所述气泵用于根据进气量参数采集待测气体;所述传感器用于生成当前时间段内所述待测气体的电信号;所述浓度预测单元,用于根据当前时间段内所述待测气体的电信号和预先建立的预测模型,确定下一时间段内所述待测气体的浓度参数,所述预测模型根据历史时间段内所述待测气体的电信号预先建立;所述参数调整单元,用于根据下一时间段内所述待测气体的浓度参数,调整进气量参数。本发明可以监测气体环境参数,提高测量数据准确性和抗干扰能力,降低成本。
-
公开(公告)号:CN117524252B
公开(公告)日:2024-04-05
申请号:CN202311505530.7
申请日:2023-11-13
Applicant: 北方工业大学
IPC: G10L25/30 , G10L25/51 , G10L25/03 , G10L25/18 , G10L25/24 , G06N3/045 , G06N3/0464 , G06N3/0495 , G06N3/096 , G06F18/25
Abstract: 本发明公开了一种基于醉汉模型的轻量化声学场景感知方法,包括:常规音频特征提取:常规音频特征通过特征转换模块处理,得到醉汉特征。常规模型训练。使用常规模型进行通道缩减和添加频率分组融合卷积的操作,以得到醉汉模型的初始版本。使用引导模块得到的初始版本的醉汉模型进行训练。使用常规模型作为教师模型,醉汉模型作为学生模型,通过知识蒸馏的方式来提升学生模型的性能。对融合后的轻量化模型进行评估,得到评估结果。根据评估结果,对轻量化模型进行优化和调整。得到最终的醉汉模型。将常规音频特征输入醉汉模型,得到声学场景感知结果。本发明的优点是:减少训练时间和计算资源的消耗,并且能获得较高的准确率和较低的损失值。
-
-
-
-
-
-
-
-
-