专利检索 ap:("深圳波洛斯科技有限公司") AND inv:"张卢军" 第 1 页

1.

发明公开
一种基于AES音频处理的本地扩音系统

公开(公告)号：CN118984438A

公开(公告)日：2024-11-19

申请号：CN202411453168.8

申请日：2024-10-17

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 朱恩德 , 胡程远 , 张卢军 , 吴真飞

IPC分类号： H04R27/00

摘要： 本申请涉及音频处理技术领域，特别是涉及一种基于AES音频处理的本地扩音系统。其中，所述音频采集模块用于采集每一初始音频信号，以得到初始音频信号列表Y；所述音频评分模块用于根据Y内的每一初始音频信号，得到对应的初始音频难度评分列表集F；所述音频处理模块用于根据Y、F和预设的多核音频处理器内的每一处理器核心的当前计算资源剩余率，将每一初始音频信号分配至对应的处理器核心进行音频处理，得到对应的目标音频信号列表M；所述本地扩音模块用于根据M，对每一目标音频信号进行本地扩音。本申请使得处理器核心的负载（计算资源总占用率）尽量均衡，节约整体的音频处理时间，确保了音频信号无延迟、高质量地实现本地扩音。

2.

发明授权
一种基于DNN降噪技术的窗口对讲系统有权

公开(公告)号：CN118571241B

公开(公告)日：2024-09-27

申请号：CN202411053564.1

申请日：2024-08-02

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 朱恩德 , 张卢军

IPC分类号： G10L21/02 , G10L25/30 , H04Q5/24 , G06N3/04 , G06N3/08

摘要： 本发明提供了一种基于DNN降噪技术的窗口对讲系统，涉及窗口对讲系统技术领域，所述系统包括：获取每一目标噪声语音样本，以得到目标噪声语音样本集A；获取每一噪声语音对应的目标纯净语音样本，以得到A对应的目标纯净语音集B；确定每一目标噪声语音对应的语音特征向量，以得到目标噪声语音特征向量列表TA；对TA中的语音特征向量进行聚类，以得到语音类别列表C；根据A、B和C，得到训练样本组集D；将D输入至预设的初始DNN模型，以得到目标DNN模型；获取待降噪语音W以及W对应的语音类别CW；将W和CW输入至目标DNN模型，以得到纯净语音；本发明在实现对噪声语音降噪的同时，提高语音降噪的效率和准确性。

3.

发明公开
一种基于DNN降噪技术的窗口对讲系统有权

公开(公告)号：CN118571241A

公开(公告)日：2024-08-30

申请号：CN202411053564.1

申请日：2024-08-02

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 朱恩德 , 张卢军

IPC分类号： G10L21/02 , G10L25/30 , H04Q5/24 , G06N3/04 , G06N3/08

摘要： 本发明提供了一种基于DNN降噪技术的窗口对讲系统，涉及窗口对讲系统技术领域，所述系统包括：获取每一目标噪声语音样本，以得到目标噪声语音样本集A；获取每一噪声语音对应的目标纯净语音样本，以得到A对应的目标纯净语音集B；确定每一目标噪声语音对应的语音特征向量，以得到目标噪声语音特征向量列表TA；对TA中的语音特征向量进行聚类，以得到语音类别列表C；根据A、B和C，得到训练样本组集D；将D输入至预设的初始DNN模型，以得到目标DNN模型；获取待降噪语音W以及W对应的语音类别CW；将W和CW输入至目标DNN模型，以得到纯净语音；本发明在实现对噪声语音降噪的同时，提高语音降噪的效率和准确性。

4.

发明授权
基于多模态大语言模型的电话录音摘要提取方法、装置有权

公开(公告)号：CN117786098B

公开(公告)日：2024-05-07

申请号：CN202410208334.1

申请日：2024-02-26

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 朱恩德 , 张卢军

IPC分类号： G06F16/34 , G06F16/33 , G10L15/02 , G10L15/183 , G10L15/26 , G10L15/30

摘要： 本发明提出一种多模态大语言模型的电话录音摘要提取方法，本发明提出一种基于多模态大语言模型的电话录音摘要提取方法，该方法应用于用户侧和服务侧，当用户侧向服务侧发送电话录音摘要提取请求后，服务侧中经过预先训练过的多模态大语言模型进行请求解析、特征提取后生成符合要求的电话录音摘要，在准确生成电话录音摘要的过程中对录音数据准确识别、高效处理，增强了用户体验，同时提升了用户办事效率。

5.

发明公开
一种基于声音检测的智能灯组数据管理系统及方法审中-实审

公开(公告)号：CN117113065A

公开(公告)日：2023-11-24

申请号：CN202311379810.8

申请日：2023-10-24

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 张卢军

IPC分类号： G06F18/213 , G01H17/00 , H05B47/12 , G06F18/241 , G06F18/20

摘要： 本发明公开了一种基于声音检测的智能灯组数据管理系统及方法，涉及声音检测技术领域，该系统运行时，通过收集房屋内的多种类型声音数据，形成声音数据组，并进行降噪和信号增强，以及声音识别算法进行实时分析，以组成第一数据集，对第一数据集进行分割和特征提取，并与预设声音事件分类标签集进行匹配，获取匹配标签频率值，组成第二数据集，对第一数据集和第二数据集进行计算，获取：检测指数Jczs，并和预设检测阈值对比，获取等级检测评估策略方案，根据方案内容，转化为具体执行指令，以响应检测到的声音事件，并记录存储，达到根据声音事件的具体情况和紧急性来决定如何响应，而不是简单地以相同方式对待所有声音事件。

6.

发明公开
一种基于神经网络的多通道语音增强方法及系统审中-实审

公开(公告)号：CN115240695A

公开(公告)日：2022-10-25

申请号：CN202210870606.5

申请日：2022-07-22

申请人： 深圳波洛斯科技有限公司

发明人： 张卢军

IPC分类号： G10L21/0208 , G10L25/30

摘要： 本发明提供的基于神经网络的多通道语音增强方法及系统，该方法包括：接收多个通道的语音信号；利用各个通道的滤波器对所述通道的语音信号进行处理，以得到各个通道对应角度的波束；根据所有所述波束确定目标波束以及波达方向；根据所述多个通道的语音信号和所述波达方向得到多个参考噪声；将所述参考噪声和目标波束输入至自适应消噪层，对所述目标波束进行增强。该多通道语音增强方法，根据历史数据训练神经网络模型，利用训练好的神经网络模型对语音信号进行增强，准确性高，不需要进行场景假设，不依赖阵列空间信息以及参数估计等先验信息。

7.

发明公开
一种基于AES音频处理技术的无线传输方法

公开(公告)号：CN118972868A

公开(公告)日：2024-11-15

申请号：CN202411453166.9

申请日：2024-10-17

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 吴真飞 , 胡程远 , 张卢军 , 朱恩德

IPC分类号： H04W16/20 , H04B17/318 , H04B17/391

摘要： 本发明提供了一种基于AES音频处理技术的无线传输方法，涉及无线传输技术领域，所述方法包括：确定无线信号从目标厂房的发射端到接收端的无线信号衰减率；获取每一种摆放形态的物体对应的无线信号衰减率，结合不摆放物体时每一预设环境因素对应的无线信号衰减率，确定受不同摆放形态的物体影响的无线信号衰减率；确定发射端在当前的环境因素以及物体摆放形态下对应的最佳的目标发射功率；本发明能够在确保音频信号无线传输稳定性的前提下，自适应的确定发射端的无线信号发射功率，避免发射端的发射功率一直处于最大发射功率的状态，进而延缓无线信号发射设备的老化，增加无线信号发射设备的使用寿命。

8.

发明公开
基于音频处理的医疗对讲系统及方法

公开(公告)号：CN118972716A

公开(公告)日：2024-11-15

申请号：CN202411453172.4

申请日：2024-10-17

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 张卢军 , 胡程远 , 吴真飞 , 朱恩德

IPC分类号： H04Q5/24 , G10L15/22 , G10L15/26 , G10L17/02 , G10L17/08 , G10L21/0232 , G16H80/00 , G06F40/216 , G06F40/295 , G06F40/30

摘要： 本发明涉及医疗语音通信技术领域，公开了一种基于音频处理的医疗对讲系统及方法，该系统包括：音频采集模块、音频定位模块、需求确定模块、指令生成模块、指令分配模块、响应人员确定模块、指令发送模块和响应处理模块。通过实施本发明，以智能语音识别和语义分析技术自动解析呼叫音频中的需求类型数据和紧急等级，实现资源的精准分配和优先处理，确保关键需求得到及时响应，精准定位患者位置并识别患者需求，迅速匹配到最合适的响应团队。

9.

发明公开
基于对抗神经网络的环境音生成方法、装置、设备及介质有权

公开(公告)号：CN117877517A

公开(公告)日：2024-04-12

申请号：CN202410264949.6

申请日：2024-03-08

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 朱恩德 , 张卢军

IPC分类号： G10L25/48 , G10L25/30 , G10L25/51

摘要： 本发明涉及数据处理技术领域，公开了基于对抗神经网络的环境音生成方法、装置、设备及介质，该方法包括：获取第i次环境音、第一描述信息、第二描述信息；利用第一判别器对第i次环境音进行评估得到第一评估结果，利用第二判别器对第i次环境音进行评估得到第二评估结果，利用自适应调整器调整生成器的参数；利用调参后的生成器基于生成第i+1次环境音；当第i+1次为预设的迭代次数时，输出第i+1次环境音为目标环境音。通过实施本发明，避免了相关技术中生成的环境音难以满足创作的情境要求和情感要求的问题，确保生成的环境音在情景和情感方面都更加接近目标，提高了音频生成的准确性和质量。

10.

发明公开
基于多模态大语言模型的电话录音摘要提取方法、装置有权

公开(公告)号：CN117786098A

公开(公告)日：2024-03-29

申请号：CN202410208334.1

申请日：2024-02-26

申请人： 深圳波洛斯科技有限公司

发明人： 魏祥成 , 胡程远 , 吴真飞 , 朱恩德 , 张卢军

IPC分类号： G06F16/34 , G06F16/33 , G10L15/02 , G10L15/183 , G10L15/26 , G10L15/30

摘要： 本发明提出一种多模态大语言模型的电话录音摘要提取方法，本发明提出一种基于多模态大语言模型的电话录音摘要提取方法，该方法应用于用户侧和服务侧，当用户侧向服务侧发送电话录音摘要提取请求后，服务侧中经过预先训练过的多模态大语言模型进行请求解析、特征提取后生成符合要求的电话录音摘要，在准确生成电话录音摘要的过程中对录音数据准确识别、高效处理，增强了用户体验，同时提升了用户办事效率。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类