-
公开(公告)号:CN114171049A
公开(公告)日:2022-03-11
申请号:CN202111601983.0
申请日:2021-12-24
申请人: 上海领世通信技术发展有限公司 , 苏州科达科技股份有限公司
IPC分类号: G10L21/0232 , G10L21/0316 , G10L25/21 , G10L25/24
摘要: 本申请提供一种回声抵消方法及装置、电子设备及存储介质,方法包括:计算远端参考信号的混响谱;计算梅尔频率倒谱相关系数;根据梅尔频率倒谱相关系数与预设单讲阈值的比较,判断是否为单讲模式;若是,则计算非线性增益系数;计算估计回声;根据估计回声与近端采集信号的功率谱的比较结果,计算出二值掩蔽膜的值;当二值掩蔽膜的值中为1的个数大于等于设定阈值时,计算抵消回声幅度增益;根据先验语音回声比和后验语音回声比,计算近端语音的存在概率;根据抵消回声幅度增益以及近端语音的存在概率计算最优非线性回声滤除增益系数;将最优非线性回声滤除增益系数与近端采集信号相乘以进行回声抵消。本申请实现回声抵消。
-
公开(公告)号:CN114171049B
公开(公告)日:2024-09-17
申请号:CN202111601983.0
申请日:2021-12-24
申请人: 上海领世通信技术发展有限公司 , 苏州科达科技股份有限公司
IPC分类号: G10L21/0232 , G10L21/0316 , G10L25/21 , G10L25/24
摘要: 本申请提供一种回声抵消方法及装置、电子设备及存储介质,方法包括:计算远端参考信号的混响谱;计算梅尔频率倒谱相关系数;根据梅尔频率倒谱相关系数与预设单讲阈值的比较,判断是否为单讲模式;若是,则计算非线性增益系数;计算估计回声;根据估计回声与近端采集信号的功率谱的比较结果,计算出二值掩蔽膜的值;当二值掩蔽膜的值中为1的个数大于等于设定阈值时,计算抵消回声幅度增益;根据先验语音回声比和后验语音回声比,计算近端语音的存在概率;根据抵消回声幅度增益以及近端语音的存在概率计算最优非线性回声滤除增益系数;将最优非线性回声滤除增益系数与近端采集信号相乘以进行回声抵消。本申请实现回声抵消。
-
公开(公告)号:CN112735458B
公开(公告)日:2024-08-27
申请号:CN202011582654.1
申请日:2020-12-28
申请人: 苏州科达科技股份有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0232
摘要: 本发明涉及音频处理技术领域,具体涉及噪声估计方法、降噪方法及电子设备,所述噪声估计方法包括获取待处理音频,获取所述待处理音频的基频及语音状态;计算所述待处理音频中当前帧的各个频点的信号功率;基于所述当前帧的各个频点的序号、所述基频以及所述语音状态,确定所述当前帧的各个频点的音频状态;根据所述当前帧的各个频点的音频状态以及所述各个频点的信号功率,确定所述当前帧的各个频点的噪声估计值。基于基音跟踪的方式进行噪声估计,能够保证语音质量;且还结合语音状态,保证跟踪速度,从而语音质量与跟踪速度之间的平衡,实现了快速且对语音损伤较小的噪声估计。
-
公开(公告)号:CN113099160B
公开(公告)日:2023-04-07
申请号:CN202110335367.9
申请日:2021-03-29
申请人: 苏州科达科技股份有限公司
IPC分类号: H04N7/15 , H04N23/695 , G10L21/0216 , G10L21/0208
摘要: 本发明提供了一种基于麦克风阵列的视频会议方法、系统、设备及存储介质,所述系统包括摄像机、固定位置麦克风阵列和可变位置麦克风阵列;所述方法包括:通过固定位置麦克风阵列和可变位置麦克风阵列采集声音,并确定声源位置;根据声源位置控制摄像机带动可变位置麦克风阵列同步旋转;根据摄像机的旋转角度确定可变位置麦克风阵列的更新位置;根据固定位置麦克风阵列的位置和可变位置麦克风阵列的更新位置形成指向声源位置的指向性波束。本发明有效解决了当前线型麦克风阵列无法实现二维声源定位和线型麦克风阵列波束形成算法中高频性能差的问题,同时解决视频会议系统中多维麦克风阵列构建成本高,且算法开发难度大的问题。
-
公开(公告)号:CN111323751B
公开(公告)日:2022-08-02
申请号:CN202010217565.0
申请日:2020-03-25
申请人: 苏州科达科技股份有限公司
IPC分类号: G01S5/18
摘要: 本申请涉及一种声源定位方法、装置及存储介质,属于计算机技术领域,该方法包括:通过在采集到声源发出的目标声音信号时确定声源的位置在第一坐标系中的第一坐标值;获取坐标转换关系和校正矩阵;使用坐标转换关系和校正矩阵将第一坐标值转换至第二坐标系,得到第二坐标值,以触发图像采集组件采集第二坐标值对应的声源的图像;可以解决在通过坐标转换矩阵转换鸣笛坐标位置时,由于坐标转换矩阵不准确所导致的转换后的鸣笛位置监测结果不够准确的问题;由于校正矩阵可以校正坐标转换关系进行坐标转换时的误差,因此,可以提高确定出的声源的位置的准确性。
-
公开(公告)号:CN109254266A
公开(公告)日:2019-01-22
申请号:CN201811320969.1
申请日:2018-11-07
申请人: 苏州科达科技股份有限公司
IPC分类号: G01S5/22
摘要: 本发明涉及一种基于麦克风阵列的声源定位方法、装置及存储介质,属于声源定位技术领域,建立麦克风阵列中每个子阵列对应的子阵列坐标系,所述麦克风阵列包括n个子阵列,所述n个子阵列存在子阵列坐标系不同的至少两个子阵列,所述n为大于1的整数;对于每个子阵列,使用时延估计算法计算声源在对应的子阵列坐标系中的子阵列坐标位置;将声源在每个子阵列对应的子阵列坐标位置转换至公共坐标系;根据所述声源在所述公共坐标系中转换后得到的坐标位置确定声源位置;可以解决使用单一的麦克风阵列确定出的声源位置可靠性不高的问题;可以保证在不增加麦克风阵列结构的复杂度的前提下,提高确定出的声源位置的可靠性。
-
公开(公告)号:CN112700785B
公开(公告)日:2024-07-23
申请号:CN202011521723.8
申请日:2020-12-21
申请人: 苏州科达特种视讯有限公司 , 苏州科达科技股份有限公司
IPC分类号: G10L21/0208 , G10L15/04 , H04M9/08
摘要: 本发明提供一种语音信号处理方法、装置及相关设备,语音信号处理方法包括:获取语音信号;获取所述语音信号的语音参数;对所述语音信号执行随动增益控制,包括:根据所述语音信号的语音参数计算所述语音信号的语音能量区间;根据所述语音能量区间以及预定能量范围,确定一目标增益;按所述目标增益调整所述语音信号;对经调整语音信号执行自动增益控制。本发明通过语音信号的处理,既保持语音信号动态,且在一个合理的幅度范围,又能配合回声抵消处理,改善回声抵消效果,从而提高整个系统的音频体验。
-
公开(公告)号:CN116055985A
公开(公告)日:2023-05-02
申请号:CN202310069278.3
申请日:2023-02-06
申请人: 苏州科达科技股份有限公司
摘要: 本申请提供一种基于音频处理将单声道转换为多声道的方法及相关设备,基于音频处理将单声道转换为多声道的方法包括:基于视频会议的会议信息,确定目标声像的位置;基于多个扬声器的位置、各扬声器的增益值与目标声像的位置的矢量关系,计算获得各扬声器的增益值;将所接收的单声道数据分别与各扬声器的增益值相乘,作为各扬声器的通道数据进行播放。本申请能够在降低视频会议的网络带宽的同时,获得多声道效果。
-
公开(公告)号:CN113453124B
公开(公告)日:2023-03-24
申请号:CN202110738126.9
申请日:2021-06-30
申请人: 苏州科达科技股份有限公司
IPC分类号: H04R3/02
摘要: 本申请提供一种音频处理方法、装置以及系统,音频处理方法包括:获取采集设备采集的音频信号;对所述采集设备采集的音频信号进行双滤波处理,所述双滤波处理包括静态滤波处理以及动态滤波处理,所述静态滤波处理的滤波系数经由声场传函估计处理获得;由扩音设备基于经所述双滤波处理的音频信号进行播放,所述扩音设备与所述采集设备位于同一空间内。本申请能够预防啸叫产生的同时,提升系统的传声增益。
-
公开(公告)号:CN110632582B
公开(公告)日:2022-03-29
申请号:CN201910912441.1
申请日:2019-09-25
申请人: 苏州科达科技股份有限公司
摘要: 本申请涉及一种声源定位方法、装置及存储介质,属于计算机技术领域,该方法包括:在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,第一坐标系是基于音频采集组件的位置建立的;获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集第二坐标系坐标值对应的声源的图像,第二坐标系是基于音频采集组件和图像采集组件的位置建立的;可以解决使用第一坐标系坐标值来采集声源图像,采集结果不准确的问题;第二坐标系为音频采集组件和图像采集组件共有的坐标系,因此根据第二坐标系坐标值来采集声源图像可以提高采集结果的准确性。
-
-
-
-
-
-
-
-
-