一种基于AES音频处理的本地扩音系统

    公开(公告)号:CN118984438A

    公开(公告)日:2024-11-19

    申请号:CN202411453168.8

    申请日:2024-10-17

    IPC分类号: H04R27/00

    摘要: 本申请涉及音频处理技术领域,特别是涉及一种基于AES音频处理的本地扩音系统。其中,所述音频采集模块用于采集每一初始音频信号,以得到初始音频信号列表Y;所述音频评分模块用于根据Y内的每一初始音频信号,得到对应的初始音频难度评分列表集F;所述音频处理模块用于根据Y、F和预设的多核音频处理器内的每一处理器核心的当前计算资源剩余率,将每一初始音频信号分配至对应的处理器核心进行音频处理,得到对应的目标音频信号列表M;所述本地扩音模块用于根据M,对每一目标音频信号进行本地扩音。本申请使得处理器核心的负载(计算资源总占用率)尽量均衡,节约整体的音频处理时间,确保了音频信号无延迟、高质量地实现本地扩音。

    一种基于DNN降噪技术的窗口对讲系统

    公开(公告)号:CN118571241B

    公开(公告)日:2024-09-27

    申请号:CN202411053564.1

    申请日:2024-08-02

    摘要: 本发明提供了一种基于DNN降噪技术的窗口对讲系统,涉及窗口对讲系统技术领域,所述系统包括:获取每一目标噪声语音样本,以得到目标噪声语音样本集A;获取每一噪声语音对应的目标纯净语音样本,以得到A对应的目标纯净语音集B;确定每一目标噪声语音对应的语音特征向量,以得到目标噪声语音特征向量列表TA;对TA中的语音特征向量进行聚类,以得到语音类别列表C;根据A、B和C,得到训练样本组集D;将D输入至预设的初始DNN模型,以得到目标DNN模型;获取待降噪语音W以及W对应的语音类别CW;将W和CW输入至目标DNN模型,以得到纯净语音;本发明在实现对噪声语音降噪的同时,提高语音降噪的效率和准确性。

    一种基于DNN降噪技术的窗口对讲系统

    公开(公告)号:CN118571241A

    公开(公告)日:2024-08-30

    申请号:CN202411053564.1

    申请日:2024-08-02

    摘要: 本发明提供了一种基于DNN降噪技术的窗口对讲系统,涉及窗口对讲系统技术领域,所述系统包括:获取每一目标噪声语音样本,以得到目标噪声语音样本集A;获取每一噪声语音对应的目标纯净语音样本,以得到A对应的目标纯净语音集B;确定每一目标噪声语音对应的语音特征向量,以得到目标噪声语音特征向量列表TA;对TA中的语音特征向量进行聚类,以得到语音类别列表C;根据A、B和C,得到训练样本组集D;将D输入至预设的初始DNN模型,以得到目标DNN模型;获取待降噪语音W以及W对应的语音类别CW;将W和CW输入至目标DNN模型,以得到纯净语音;本发明在实现对噪声语音降噪的同时,提高语音降噪的效率和准确性。

    一种基于声音检测的智能灯组数据管理系统及方法

    公开(公告)号:CN117113065A

    公开(公告)日:2023-11-24

    申请号:CN202311379810.8

    申请日:2023-10-24

    摘要: 本发明公开了一种基于声音检测的智能灯组数据管理系统及方法,涉及声音检测技术领域,该系统运行时,通过收集房屋内的多种类型声音数据,形成声音数据组,并进行降噪和信号增强,以及声音识别算法进行实时分析,以组成第一数据集,对第一数据集进行分割和特征提取,并与预设声音事件分类标签集进行匹配,获取匹配标签频率值,组成第二数据集,对第一数据集和第二数据集进行计算,获取:检测指数Jczs,并和预设检测阈值对比,获取等级检测评估策略方案,根据方案内容,转化为具体执行指令,以响应检测到的声音事件,并记录存储,达到根据声音事件的具体情况和紧急性来决定如何响应,而不是简单地以相同方式对待所有声音事件。

    一种基于神经网络的多通道语音增强方法及系统

    公开(公告)号:CN115240695A

    公开(公告)日:2022-10-25

    申请号:CN202210870606.5

    申请日:2022-07-22

    发明人: 张卢军

    IPC分类号: G10L21/0208 G10L25/30

    摘要: 本发明提供的基于神经网络的多通道语音增强方法及系统,该方法包括:接收多个通道的语音信号;利用各个通道的滤波器对所述通道的语音信号进行处理,以得到各个通道对应角度的波束;根据所有所述波束确定目标波束以及波达方向;根据所述多个通道的语音信号和所述波达方向得到多个参考噪声;将所述参考噪声和目标波束输入至自适应消噪层,对所述目标波束进行增强。该多通道语音增强方法,根据历史数据训练神经网络模型,利用训练好的神经网络模型对语音信号进行增强,准确性高,不需要进行场景假设,不依赖阵列空间信息以及参数估计等先验信息。

    一种基于AES音频处理技术的无线传输方法

    公开(公告)号:CN118972868A

    公开(公告)日:2024-11-15

    申请号:CN202411453166.9

    申请日:2024-10-17

    摘要: 本发明提供了一种基于AES音频处理技术的无线传输方法,涉及无线传输技术领域,所述方法包括:确定无线信号从目标厂房的发射端到接收端的无线信号衰减率;获取每一种摆放形态的物体对应的无线信号衰减率,结合不摆放物体时每一预设环境因素对应的无线信号衰减率,确定受不同摆放形态的物体影响的无线信号衰减率;确定发射端在当前的环境因素以及物体摆放形态下对应的最佳的目标发射功率;本发明能够在确保音频信号无线传输稳定性的前提下,自适应的确定发射端的无线信号发射功率,避免发射端的发射功率一直处于最大发射功率的状态,进而延缓无线信号发射设备的老化,增加无线信号发射设备的使用寿命。

    基于对抗神经网络的环境音生成方法、装置、设备及介质

    公开(公告)号:CN117877517A

    公开(公告)日:2024-04-12

    申请号:CN202410264949.6

    申请日:2024-03-08

    IPC分类号: G10L25/48 G10L25/30 G10L25/51

    摘要: 本发明涉及数据处理技术领域,公开了基于对抗神经网络的环境音生成方法、装置、设备及介质,该方法包括:获取第i次环境音、第一描述信息、第二描述信息;利用第一判别器对第i次环境音进行评估得到第一评估结果,利用第二判别器对第i次环境音进行评估得到第二评估结果,利用自适应调整器调整生成器的参数;利用调参后的生成器基于生成第i+1次环境音;当第i+1次为预设的迭代次数时,输出第i+1次环境音为目标环境音。通过实施本发明,避免了相关技术中生成的环境音难以满足创作的情境要求和情感要求的问题,确保生成的环境音在情景和情感方面都更加接近目标,提高了音频生成的准确性和质量。