基于边缘计算的野外鸟类自动监测方法及系统

    公开(公告)号:CN118173103A

    公开(公告)日:2024-06-11

    申请号:CN202410600103.5

    申请日:2024-05-15

    摘要: 本申请涉及语音处理技术领域,提出了基于边缘计算的野外鸟类自动监测方法及系统,包括:获取鸟类音频信号数据;根据鸟类音频信号数据获取活动音频区间;根据活动音频区间获取时域近似因子及频域近似因子;根据时域近似因子及频域近似因子获取声源同类置信度;根据声源同类置信度获取生活区域原住指数;根据生活区域原住指数获取迁移行为异常指数;基于迁移行为异常指数获取区域鸟类迁徙度量指数;基于区域鸟类迁徙度量指数得到鸟类迁徙的监测结果。本申请通过构建区域鸟类迁徙度量指数,实现对野外鸟类的自动监测,避免对野外鸟类自动监测产生误判的现象。

    语音信号处理方法、装置、电子设备以及存储介质

    公开(公告)号:CN113763978B

    公开(公告)日:2024-05-03

    申请号:CN202110450066.0

    申请日:2021-04-25

    发明人: 梁俊斌

    IPC分类号: G10L21/0208 G10L21/0364

    摘要: 本申请实施例公开了一种语音信号处理方法、装置、电子设备以及存储介质,包括:在通话过程中获取采集信号以及参考信号;基于所述参考信号对所述采集信号进行回声消除处理,得到处理后语音信号;提取所述采集信号对应的第一信号音频特征以及所述参考信号对应的第二信号音频特征;根据所述第一信号音频特征以及第二信号音频特征,确定所述采集信号中近端语音信号的信号衰减;基于所述信号衰减抑制处理后语音信号中残留的回声信号,并对所述参考信号的音量进行调整,该方案可以提高语音信号处理的准确性。

    一种语音播报方法、设备、计算机存储介质及系统

    公开(公告)号:CN111554317B

    公开(公告)日:2024-04-09

    申请号:CN202010391833.0

    申请日:2020-05-11

    IPC分类号: G10L21/0364

    摘要: 本申请实施例提供了一种语音播报方法、设备、计算机存储介质及系统,该方法应用于语音设备,包括:接收声音采集设备发送的环境噪声参数;基于所述环境噪声参数,确定待播放的语音信息对应的目标播放参数;其中,所述目标播放参数包括目标音量参数和/或目标音色参数;根据所确定的目标播放参数,播放所述语音信息;这样,通过接收声音采集设备采集到的环境噪声参数,语音设备能够根据环境噪声自适应调节语音信息播放时的音量和/或音色,从而使得语音设备的声音清晰可辨,提高了语音设备的使用性能。

    一种基于视听不一致效应的声环境主观感受调控方法

    公开(公告)号:CN117765958A

    公开(公告)日:2024-03-26

    申请号:CN202311681360.8

    申请日:2023-12-08

    摘要: 本发明公开了一种基于视听不一致效应的声环境主观感受调控方法,属于调节声环境主观感受技术领域,包括:采集和识别声环境中能够显著影响人体主观感受的烦恼声音成分;基于专家经验或人工智能方法,根据烦恼声音成分,获取声音成分与烦恼声音成分相近但让人感觉舒适的视觉场景;结合视觉场景和声环境,基于视听不一致效应,形成若干调控方案;征集受试者对各调控方案中的声主观感受进行评价,依据声主观感受的改善程度得到最优调控方案,实施最优调控方案并做后评价以确认调控效果。本发明通过在环境中融入声音成分相似但让人感觉更舒适的视觉场景,利用视听不一致效应,实现声主观感受调控,为调控声环境主观感受提供新的思路。

    使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法

    公开(公告)号:CN117597733A

    公开(公告)日:2024-02-23

    申请号:CN202180099543.1

    申请日:2021-06-30

    IPC分类号: G10L21/0272 G10L21/0364

    摘要: 一种生成双耳信号的系统和方法,包括:通过处理装置接收包括语音分量和噪声分量的声音信号(104),以及通过所述处理装置使用深度神经网络(DNN)将所述声音信号转换为第一信号和第二信号(106)。所述转换还包括:通过所述DNN的编码层将所述声音信号编码为潜在空间中的声音信号表示(108);通过所述DNN的渲染层将所述声音信号表示渲染为潜在空间中的第一信号表示和第二信号表示(110);以及通过所述DNN的解码层将所述第一信号表示解码为第一信号,以及将所述第二信号表示解码为第二信号(112)。

    自动调整特定声源的方法及应用其的电子装置

    公开(公告)号:CN113270109B

    公开(公告)日:2023-05-26

    申请号:CN202010092759.2

    申请日:2020-02-14

    摘要: 一种自动调整特定声源的方法及应用其的电子装置。电子装置包括一第一声音信号辨识单元、一第一多声源判定单元、一方向性分析单元、一方向性分离单元、一第二声音信号辨识单元、一第二多声源判定单元及一声音信号调整单元。第一声音信号辨识单元用以对一原始声音频信号进行数种特定声源的一机率辨识程序。若原始声音频信号的声源数量大于或等于二,则方向性分析单元对原始声音频信号进行一方向性分析程序。方向性分离单元依据原始声音频信号的方向分析程序的结果,分离出至少一特定方向子信号。若特定方向子信号的声源数量等于一,则声音信号调整单元进行一声源调整程序。

    一种基于振动传感器的低分贝声音感应方法及系统

    公开(公告)号:CN115881149A

    公开(公告)日:2023-03-31

    申请号:CN202211493272.0

    申请日:2022-11-25

    发明人: 何青峰

    摘要: 本发明提供了一种基于振动传感器的低分贝声音感应方法及系统,其方法包括:步骤1:将识别低分贝声音的振动传感器设置在通话回复端,当需要通话回复时,基于设置的振动传感器采集用户预设区域的声带振动信号;步骤2:将采集的声带振动信号进信号识别,得到回复语音;步骤3:对所述回复语音进行去噪优化以及声音放大处理,并基于所述通话回复端传输到接听端。通过设置振动传感器来对声带区域进行振动信号采集,并进行信号识别以及去噪、放大处理,可以提高低分贝通话体验感。

    一种机载话音处理平台
    8.
    发明公开

    公开(公告)号:CN115841820A

    公开(公告)日:2023-03-24

    申请号:CN202310157237.X

    申请日:2023-02-23

    摘要: 本发明公开了一种机载话音处理平台,所述机载话音处理平台包括模拟音频处理单元和数字音频处理单元;所述模拟音频处理单元用于实现飞行员麦克风输出的模拟音频信号的采集与转换,并将转换为的数字话音信号输入数字音频处理单元;所述数字音频处理单元至少包括自适应噪声抑制模块和自动增益控制模块;所述自适应噪声抑制模块采用频谱相减噪声抑制算法完成数字话音信号的噪声抑制;所述自动增益控制模块采用自适应话音增强算法对完成噪声抑制处理的数字话音信号进行语音增强,并将完成语音增强的信号送入飞行员座舱。本发明机载话音处理平台有效地提高了通话的可听可懂度,同时也较小了话音延迟。解决了机载环境下飞行员通话强噪声干扰问题。

    一种自适应语音增强的语音交互方法、系统及存储介质

    公开(公告)号:CN114464207A

    公开(公告)日:2022-05-10

    申请号:CN202111393902.2

    申请日:2021-11-23

    申请人: 江汉大学

    摘要: 本申请提供了一种自适应语音增强的语音交互方法,该方法包括:获取用户输入的语音文件,并通过语音识别得到相应的文本文件;根据seq2seq端到端模型得到机器回复的文本文件;将机器回复的文本文件进行文本分析,并送入声学模型中进行训练,获取语音特征,通过声码器合成语音;获取伦巴第语音音频的德语语料库作为训练数据集,采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0;通过声压计实时获取当前环境噪声等级;将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试,根据实时噪声等级进行相应的语音风格转换,并输出语音增强后的语音。