-
公开(公告)号:CN118072740A
公开(公告)日:2024-05-24
申请号:CN202311866742.8
申请日:2023-12-29
申请人: 上海秒针网络科技有限公司
摘要: 本申请涉及语音处理技术领域,公开一种用于说话人聚类的方法,包括:获取待处理音频的语音特征嵌入向量序列,语音特征嵌入向量序列中包括多个语音特征嵌入向量。根据语音特征嵌入向量序列获取余弦相似度矩阵。根据第一预设聚合系数对余弦相似度矩阵进行初次聚类,获得第一备选聚类结果。根据第二预设聚合系数对第一备选聚类结果进行二次聚类,获得目标聚类结果。这样,通过设置第一预设聚合系数和第二预设聚合系数,每次聚类时分别按照第一预设聚合系数和第二预设聚合系数去聚合,能够实现对说话人聚类的聚类时长的控制,同时提高聚类效果。本申请还公开一种用于说话人聚类的装置。