专利检索 ipc:"G10L21/0364" 第 1 页

1.

发明公开
基于边缘计算的野外鸟类自动监测方法及系统审中-实审

公开(公告)号：CN118173103A

公开(公告)日：2024-06-11

申请号：CN202410600103.5

申请日：2024-05-15

申请人： 百鸟数据科技(北京)有限责任公司

发明人： 滕兵 , 张晓东 , 蔡宪文

IPC分类号： G10L17/26 , G10L17/16 , G10L17/14 , G10L21/0224 , G10L21/0232 , G10L21/0364

摘要： 本申请涉及语音处理技术领域，提出了基于边缘计算的野外鸟类自动监测方法及系统，包括：获取鸟类音频信号数据；根据鸟类音频信号数据获取活动音频区间；根据活动音频区间获取时域近似因子及频域近似因子；根据时域近似因子及频域近似因子获取声源同类置信度；根据声源同类置信度获取生活区域原住指数；根据生活区域原住指数获取迁移行为异常指数；基于迁移行为异常指数获取区域鸟类迁徙度量指数；基于区域鸟类迁徙度量指数得到鸟类迁徙的监测结果。本申请通过构建区域鸟类迁徙度量指数，实现对野外鸟类的自动监测，避免对野外鸟类自动监测产生误判的现象。

2.

发明授权
语音信号处理方法、装置、电子设备以及存储介质有权

公开(公告)号：CN113763978B

公开(公告)日：2024-05-03

申请号：CN202110450066.0

申请日：2021-04-25

申请人： 腾讯科技(深圳)有限公司

发明人： 梁俊斌

IPC分类号： G10L21/0208 , G10L21/0364

摘要： 本申请实施例公开了一种语音信号处理方法、装置、电子设备以及存储介质，包括：在通话过程中获取采集信号以及参考信号；基于所述参考信号对所述采集信号进行回声消除处理，得到处理后语音信号；提取所述采集信号对应的第一信号音频特征以及所述参考信号对应的第二信号音频特征；根据所述第一信号音频特征以及第二信号音频特征，确定所述采集信号中近端语音信号的信号衰减；基于所述信号衰减抑制处理后语音信号中残留的回声信号，并对所述参考信号的音量进行调整，该方案可以提高语音信号处理的准确性。

3.

发明授权
一种语音播报方法、设备、计算机存储介质及系统有权转让

公开(公告)号：CN111554317B

公开(公告)日：2024-04-09

申请号：CN202010391833.0

申请日：2020-05-11

申请人： 美智纵横科技有限责任公司

发明人： 胡利萍 , 王文浩 , 卢晓莹 , 周庆东

IPC分类号： G10L21/0364

摘要： 本申请实施例提供了一种语音播报方法、设备、计算机存储介质及系统，该方法应用于语音设备，包括：接收声音采集设备发送的环境噪声参数；基于所述环境噪声参数，确定待播放的语音信息对应的目标播放参数；其中，所述目标播放参数包括目标音量参数和/或目标音色参数；根据所确定的目标播放参数，播放所述语音信息；这样，通过接收声音采集设备采集到的环境噪声参数，语音设备能够根据环境噪声自适应调节语音信息播放时的音量和/或音色，从而使得语音设备的声音清晰可辨，提高了语音设备的使用性能。

4.

发明公开
一种基于视听不一致效应的声环境主观感受调控方法审中-实审

公开(公告)号：CN117765958A

公开(公告)日：2024-03-26

申请号：CN202311681360.8

申请日：2023-12-08

申请人： 浙江科技学院 , 交通运输部公路科学研究院

发明人： 李争光 , 袁旻忞 , 倪栋

IPC分类号： G10L21/007 , G10L21/0364 , G10L25/51 , G10L25/30 , G10L25/03

摘要： 本发明公开了一种基于视听不一致效应的声环境主观感受调控方法，属于调节声环境主观感受技术领域，包括：采集和识别声环境中能够显著影响人体主观感受的烦恼声音成分；基于专家经验或人工智能方法，根据烦恼声音成分，获取声音成分与烦恼声音成分相近但让人感觉舒适的视觉场景；结合视觉场景和声环境，基于视听不一致效应，形成若干调控方案；征集受试者对各调控方案中的声主观感受进行评价，依据声主观感受的改善程度得到最优调控方案，实施最优调控方案并做后评价以确认调控效果。本发明通过在环境中融入声音成分相似但让人感觉更舒适的视觉场景，利用视听不一致效应，实现声主观感受调控，为调控声环境主观感受提供新的思路。

5.

发明公开
使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法审中-实审

公开(公告)号：CN117597733A

公开(公告)日：2024-02-23

申请号：CN202180099543.1

申请日：2021-06-30

申请人： 西北工业大学

发明人： 陈景东 , 潘宁宁 , 王玉竹 , 杰卡布·贝内斯特

IPC分类号： G10L21/0272 , G10L21/0364

摘要： 一种生成双耳信号的系统和方法，包括：通过处理装置接收包括语音分量和噪声分量的声音信号(104)，以及通过所述处理装置使用深度神经网络(DNN)将所述声音信号转换为第一信号和第二信号(106)。所述转换还包括：通过所述DNN的编码层将所述声音信号编码为潜在空间中的声音信号表示(108)；通过所述DNN的渲染层将所述声音信号表示渲染为潜在空间中的第一信号表示和第二信号表示(110)；以及通过所述DNN的解码层将所述第一信号表示解码为第一信号，以及将所述第二信号表示解码为第二信号(112)。

6.

发明授权
自动调整特定声源的方法及应用其的电子装置有权

公开(公告)号：CN113270109B

公开(公告)日：2023-05-26

申请号：CN202010092759.2

申请日：2020-02-14

申请人： 宏碁股份有限公司

发明人： 杜博仁 , 张嘉仁 , 曾凯盟

IPC分类号： G10L21/028 , G10L21/0364 , G10L15/06

摘要： 一种自动调整特定声源的方法及应用其的电子装置。电子装置包括一第一声音信号辨识单元、一第一多声源判定单元、一方向性分析单元、一方向性分离单元、一第二声音信号辨识单元、一第二多声源判定单元及一声音信号调整单元。第一声音信号辨识单元用以对一原始声音频信号进行数种特定声源的一机率辨识程序。若原始声音频信号的声源数量大于或等于二，则方向性分析单元对原始声音频信号进行一方向性分析程序。方向性分离单元依据原始声音频信号的方向分析程序的结果，分离出至少一特定方向子信号。若特定方向子信号的声源数量等于一，则声音信号调整单元进行一声源调整程序。

7.

发明公开
一种基于振动传感器的低分贝声音感应方法及系统审中-公开

公开(公告)号：CN115881149A

公开(公告)日：2023-03-31

申请号：CN202211493272.0

申请日：2022-11-25

申请人： 珠海市魅族科技有限公司

发明人： 何青峰

IPC分类号： G10L21/0208 , G10L21/0364 , H04M1/02

摘要： 本发明提供了一种基于振动传感器的低分贝声音感应方法及系统，其方法包括：步骤1：将识别低分贝声音的振动传感器设置在通话回复端，当需要通话回复时，基于设置的振动传感器采集用户预设区域的声带振动信号；步骤2：将采集的声带振动信号进信号识别，得到回复语音；步骤3：对所述回复语音进行去噪优化以及声音放大处理，并基于所述通话回复端传输到接听端。通过设置振动传感器来对声带区域进行振动信号采集，并进行信号识别以及去噪、放大处理，可以提高低分贝通话体验感。

8.

发明公开
一种机载话音处理平台审中-实审

公开(公告)号：CN115841820A

公开(公告)日：2023-03-24

申请号：CN202310157237.X

申请日：2023-02-23

申请人： 中国电子科技集团公司第十研究所

发明人： 李声飞 , 朱宇 , 顾生辉 , 王煦 , 马建民 , 张为

IPC分类号： G10L21/0232 , G10L21/0264 , G10L21/0364

摘要： 本发明公开了一种机载话音处理平台，所述机载话音处理平台包括模拟音频处理单元和数字音频处理单元；所述模拟音频处理单元用于实现飞行员麦克风输出的模拟音频信号的采集与转换，并将转换为的数字话音信号输入数字音频处理单元；所述数字音频处理单元至少包括自适应噪声抑制模块和自动增益控制模块；所述自适应噪声抑制模块采用频谱相减噪声抑制算法完成数字话音信号的噪声抑制；所述自动增益控制模块采用自适应话音增强算法对完成噪声抑制处理的数字话音信号进行语音增强，并将完成语音增强的信号送入飞行员座舱。本发明机载话音处理平台有效地提高了通话的可听可懂度，同时也较小了话音延迟。解决了机载环境下飞行员通话强噪声干扰问题。

9.

发明公开
基于噪声指标和语音可懂度指标来调整音频和非音频特征审中-实审

公开(公告)号：CN114830233A

公开(公告)日：2022-07-29

申请号：CN202080085359.7

申请日：2020-12-09

申请人： 杜比实验室特许公司

发明人： T·A·波特 , D·S·坦普尔顿 , J·G·海斯 , D·M·库珀

IPC分类号： G10L21/0364 , G10L25/48 , H04S7/00 , H04N21/488 , H04N21/434 , G11B27/031 , H04R5/04 , H04N5/445 , G10L25/60 , G10L19/16

摘要： 一些实施方式涉及确定噪声指标和/或语音可懂度指标以及确定与噪声指标和/或语音可懂度指标相对应的补偿过程。补偿过程可以涉及更改对音频数据的处理和/或应用基于非音频的补偿方法。在一些示例中，更改对音频数据的处理不涉及将宽带增益增加应用于音频信号。一些示例涉及在音频环境中应用补偿过程。其他示例涉及确定与补偿过程相对应的补偿元数据以及将包括经编码补偿元数据、经编码视频数据和经编码音频数据的经编码内容流从第一设备传输到一个或多个其他设备。

10.

发明公开
一种自适应语音增强的语音交互方法、系统及存储介质审中-实审

公开(公告)号：CN114464207A

公开(公告)日：2022-05-10

申请号：CN202111393902.2

申请日：2021-11-23

申请人： 江汉大学

发明人： 李登实 , 叶海洋 , 赵兰馨 , 高雨 , 薛童 , 陈天卓 , 陈奥 , 何佳欣 , 吴梓煊

IPC分类号： G10L21/0364 , G10L15/22 , G10L15/26 , G10L15/16 , G10L15/06 , G10L15/02 , G10L25/30

摘要： 本申请提供了一种自适应语音增强的语音交互方法，该方法包括：获取用户输入的语音文件，并通过语音识别得到相应的文本文件；根据seq2seq端到端模型得到机器回复的文本文件；将机器回复的文本文件进行文本分析，并送入声学模型中进行训练，获取语音特征，通过声码器合成语音；获取伦巴第语音音频的德语语料库作为训练数据集，采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0；通过声压计实时获取当前环境噪声等级；将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试，根据实时噪声等级进行相应的语音风格转换，并输出语音增强后的语音。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类