选择性会议摘要
    12.
    发明公开

    公开(公告)号:CN113140216A

    公开(公告)日:2021-07-20

    申请号:CN202110568563.0

    申请日:2016-02-03

    Abstract: 本公开涉及选择性会议摘要。各种公开的实现涉及对涉及多个会议参与者的会议的记录的处理和/或回放。本文公开的一些实现涉及接收对应于涉及多个会议参与者的至少一个会议的记录的音频数据。在一些示例中,所接收的音频数据的仅一部分将被选择作为回放音频数据。该选择过程可包括主题选择过程,讲话突发过滤过程,和/或声学特征选择过程。一些示例包括接收目标回放持续时间的指示。选择音频数据的该部分可包括使得回放音频数据的持续时间处于目标回放持续时间的阈值时间差内。

    选择性会议摘要
    13.
    发明授权

    公开(公告)号:CN107210034B

    公开(公告)日:2021-06-01

    申请号:CN201680008681.3

    申请日:2016-02-03

    Abstract: 各种公开的实现涉及对涉及多个会议参与者的会议的记录的处理和/或回放。本文公开的一些实现涉及接收对应于涉及多个会议参与者的至少一个会议的记录的音频数据。在一些示例中,所接收的音频数据的仅一部分将被选择作为回放音频数据。该选择过程可包括主题选择过程,讲话突发过滤过程,和/或声学特征选择过程。一些示例包括接收目标回放持续时间的指示。选择音频数据的该部分可包括使得回放音频数据的持续时间处于目标回放持续时间的阈值时间差内。

    电话会议中的在感知上连续的混合

    公开(公告)号:CN106063238A

    公开(公告)日:2016-10-26

    申请号:CN201580010640.3

    申请日:2015-02-17

    CPC classification number: H04M3/568 G10L25/51 G10L25/78 H04M3/569

    Abstract: 一种在音频电话会议混合系统中将多个当前音频上行传输流混合在一起以产生至少一个音频输出流的方法,所述音频电话会议混合系统是混合多个第一音频上行传输输入流以产生用于下行传输到至少一个会议参与者的至少一个音频下行传输输出流的类型,其中所述多个第一音频上行传输输入流包含包括被感测到的音频的音频信息以及相关联的控制信息,其中所述音频上行传输输入流可以潜在地包括连续传输(CTX)流和非连续传输(DTX)流,所述方法包括以下步骤:(a)确定指示每个当前音频上行传输流的可能重要性的冗长量度;以及(b)当至少一个当前音频上行传输流可以包括CTX流时,在混合中利用至少一个CTX流以产生所述至少一个音频输出流。

    用于训练声学模型的每一代的数据增强

    公开(公告)号:CN114175144A

    公开(公告)日:2022-03-11

    申请号:CN202080054978.X

    申请日:2020-07-30

    Abstract: 在一些实施例中,用于训练声学模型的方法和系统,其中训练包括数据准备阶段之后的训练循环(包括至少一代)。在训练循环期间,训练数据被增强以生成增强训练数据。在训练循环的每一代期间,增强训练数据中的至少一些被用于训练模型。可以通过不同地增强(例如,使用不同的增强参数集合来增强)训练数据中的至少一些来生成在每一代期间使用的增强训练数据。在一些实施例中,增强是在频域中执行的,其中训练数据被组织到频带中。声学模型可以是被用于(被训练用于)执行语音分析(例如,唤醒词检测、语音活动检测、语音识别或说话者识别)和/或噪声抑制的类型。

    会议搜索以及搜索结果的回放

    公开(公告)号:CN107210045B

    公开(公告)日:2020-11-17

    申请号:CN201680008612.2

    申请日:2016-02-03

    Abstract: 各种公开的实现涉及对涉及多个会议参与者的会议的记录的处理和/或回放。本文公开的一些实现涉及接收对应于涉及多个会议参与者的至少一个会议的记录的音频数据。音频数据被分别记录的来自多个端点的会议参与者语音数据,或来自对应于多个会议参与者的单个端点的、并且包括所述多个会议参与者中的每个会议参与者的空间信息的会议参与者语音数据。音频数据的搜索可以基于一个或多个搜索参数。搜索是针对音频数据的多个特征的并发搜索。会议参与者语音的实例可被渲染到虚拟声学空间的至少两个不同的虚拟会议参与者位置。

Patent Agency Ranking