用于说话人聚类的方法及装置
    1.
    发明公开

    公开(公告)号:CN118072740A

    公开(公告)日:2024-05-24

    申请号:CN202311866742.8

    申请日:2023-12-29

    发明人: 魏刘巍 高翔

    IPC分类号: G10L17/02 G10L17/16 G10L17/18

    摘要: 本申请涉及语音处理技术领域,公开一种用于说话人聚类的方法,包括:获取待处理音频的语音特征嵌入向量序列,语音特征嵌入向量序列中包括多个语音特征嵌入向量。根据语音特征嵌入向量序列获取余弦相似度矩阵。根据第一预设聚合系数对余弦相似度矩阵进行初次聚类,获得第一备选聚类结果。根据第二预设聚合系数对第一备选聚类结果进行二次聚类,获得目标聚类结果。这样,通过设置第一预设聚合系数和第二预设聚合系数,每次聚类时分别按照第一预设聚合系数和第二预设聚合系数去聚合,能够实现对说话人聚类的聚类时长的控制,同时提高聚类效果。本申请还公开一种用于说话人聚类的装置。