音频处理方法和音频处理设备
摘要:
本发明提供一种音频处理方法和设备,该方法包括以下步骤:a)根据音频物理特性将音频初始地分段为一个或多个片段;对于所述一个或多个片段中的每个片段:b)在该片段中的多个时间点的每个处,提取一种或多种音频特征作为音频特征向量;c)针对所述多个时间点的每个,通过所述音频特征向量来计算该时间点的贝叶斯信息准则值;d)通过各个时间点的贝叶斯信息准则值中的最大值所对应的时间点,将该片段划分为第一部分和第二部分;以及e)通过第一部分和第二部分中的由各个时间点的贝叶斯信息准则值构成的相对于时间点的两个曲线的分布,来判断该最大值所对应的时间点是否是说话人改变点。
公开/授权文献
0/0