电话会议中的在感知上连续的混合

    公开(公告)号:CN106063238B

    公开(公告)日:2019-07-09

    申请号:CN201580010640.3

    申请日:2015-02-17

    CPC classification number: H04M3/568 G10L25/51 G10L25/78 H04M3/569

    Abstract: 一种在音频电话会议混合系统中将多个当前音频上行传输流混合在一起以产生至少一个音频输出流的方法,所述音频电话会议混合系统是混合多个第一音频上行传输输入流以产生用于下行传输到至少一个会议参与者的至少一个音频下行传输输出流的类型,其中所述多个第一音频上行传输输入流包含包括被感测到的音频的音频信息以及相关联的控制信息,其中所述音频上行传输输入流可以潜在地包括连续传输(CTX)流和非连续传输(DTX)流,所述方法包括以下步骤:(a)确定指示每个当前音频上行传输流的可能重要性的冗长量度;以及(b)当至少一个当前音频上行传输流可以包括CTX流时,在混合中利用至少一个CTX流以产生所述至少一个音频输出流。

    感知质量比会议中原始听到的更高的后会议回放系统

    公开(公告)号:CN107211027A

    公开(公告)日:2017-09-26

    申请号:CN201680008715.9

    申请日:2016-02-03

    Abstract: 本公开的一些方面涉及与诸如电话会议的会议对应的音频数据的记录、处理和回放。在一些电话会议实现中,在会议记录被回放时所听到的音频体验可显著不同于在原始电话会议期间的单个会议参与者的音频体验。在一些实现中,记录的音频数据可包括在电话会议期间不可用的至少一些音频数据。在一些示例中,被回放的音频数据的空间特性可不同于电话会议的参与者收听到的音频的空间特性。

    空间表示学习
    24.
    发明公开
    空间表示学习 审中-实审

    公开(公告)号:CN118786482A

    公开(公告)日:2024-10-15

    申请号:CN202380024701.6

    申请日:2023-02-28

    Abstract: 一些公开的方法涉及:接收包括未标记的多声道音频数据的多声道音频数据;从未标记的多声道音频数据中提取音频特征数据;对音频特征数据的一部分应用空间掩蔽过程;对被掩蔽的音频特征数据应用上下文编码过程,以产生潜在空间中的预测空间嵌入;获得潜在空间中的参考空间嵌入;至少部分地基于预测空间嵌入与参考空间嵌入之间的差异来确定损失函数梯度;以及根据损失函数梯度更新上下文编码过程,直到获得一个或多个收敛度量。

    机器学习辅助的空间噪声估计和抑制

    公开(公告)号:CN116547753A

    公开(公告)日:2023-08-04

    申请号:CN202180080882.5

    申请日:2021-11-04

    Abstract: 在实施例中,一种方法包括:接收输入音频信号的功率频谱的频带以及麦克风协方差,并且针对每个频带:使用分类器来估计语音和噪声的相应概率;基于所述频带的所述麦克风协方差和所述概率,使用方向性模型来估计语音和噪声的一组均值、或语音和噪声的一组均值和协方差;使用电平模型基于所述概率和所述功率频谱来估计噪声功率的均值和协方差;基于所述方向性模型来确定第一噪声抑制增益;基于所述电平模型来确定第二噪声抑制增益;基于所述输入音频信号的信噪比,选择第一噪声抑制增益或第二噪声抑制增益或这两者之和;以及通过所选择的噪声抑制增益来缩放输入信号的时频表示。

    感知质量比会议中原始听到的更高的后会议回放系统

    公开(公告)号:CN111866022A

    公开(公告)日:2020-10-30

    申请号:CN202010773346.0

    申请日:2016-02-03

    Abstract: 本公开涉及感知质量比会议中原始听到的更高的后会议回放系统。本公开的一些方面涉及与诸如电话会议的会议对应的音频数据的记录、处理和回放。在一些电话会议实现中,在会议记录被回放时所听到的音频体验可显著不同于在原始电话会议期间的单个会议参与者的音频体验。在一些实现中,记录的音频数据可包括在电话会议期间不可用的至少一些音频数据。在一些示例中,被回放的音频数据的空间特性可不同于电话会议的参与者收听到的音频的空间特性。

    声场的辅助增大
    29.
    发明授权

    公开(公告)号:CN106576204B

    公开(公告)日:2019-08-20

    申请号:CN201580035796.7

    申请日:2015-07-01

    Abstract: 一种用于更改在音频环境的多声道声场表示中的感兴趣音频信号的方法,该方法包括以下步骤:(a)从声场表示提取感兴趣信号;(b)确定残差声场信号;(c)输入与感兴趣信号相关联的另一相关联的音频信号;(d)将相关联的音频信号变换成与残差声场兼容的对应的相关联的声场信号;及(e)将残差声场信号与相关联的声场信号组合以产生输出声场信号。

    电话会议中的在感知上连续的混合

    公开(公告)号:CN110072021A

    公开(公告)日:2019-07-30

    申请号:CN201910508336.1

    申请日:2015-02-17

    Abstract: 本发明涉及电话会议中的在感知上连续的混合。一种在音频电话会议混合系统中将多个当前音频上行传输流混合在一起以产生至少一个音频输出流的方法,所述音频电话会议混合系统是混合多个第一音频上行传输输入流以产生用于下行传输到至少一个会议参与者的至少一个音频下行传输输出流的类型,其中所述多个第一音频上行传输输入流包含包括被感测到的音频的音频信息以及相关联的控制信息,其中所述音频上行传输输入流可以潜在地包括连续传输(CTX)流和非连续传输(DTX)流,所述方法包括以下步骤:(a)确定指示每个当前音频上行传输流的可能重要性的冗长量度;以及(b)当至少一个当前音频上行传输流可以包括CTX流时,在混合中利用至少一个CTX流以产生所述至少一个音频输出流。

Patent Agency Ranking