一种基于多通路声学谐振腔的说话人定位装置与方法

    公开(公告)号:CN117789765A

    公开(公告)日:2024-03-29

    申请号:CN202311799041.7

    申请日:2023-12-26

    摘要: 本发明公开了一种基于多通路声学谐振腔的说话人定位装置,包括麦克风和多通路声学谐振腔结构,所述麦克风通过信号采集设备连接计算机,所述多通路声学谐振腔结构包括矩形主体、四个通路和长方体空气腔,所述四个通路呈十字型相交设置,其交点位于矩形主体的中心处,并且在该中心处设置有所述麦克风,同时在每条通路上从外向内依次设有两个长方体空气腔,其中靠近入口处的长方体空气腔尺寸大于靠近中心处的长方体空气腔。本发明利用不同方向上的谐振腔结构对语音信号进行频率上的调制,使得各个方向的入射声具有不同的声纹特征,再结合基于深度学习的声纹识别算法,完成对声音方向的判别,实现说话人定位。

    一种基于图神经网络的通用缺陷检测方法

    公开(公告)号:CN114489785A

    公开(公告)日:2022-05-13

    申请号:CN202210167928.3

    申请日:2022-02-23

    申请人: 南京大学

    摘要: 本发明公开一种基于图神经网络的通用缺陷检测方法,包括以下步骤:程序预处理,提取程序语义信息图节点的语义特征值,并对图形表示向量化,生成模型需要的输入形式;构建基于图神经网络的通用缺陷预测模型,用标签标记缺陷样本分布,训练图神经网络的缺陷预测能力,将训练过程中的最优模型作为通用缺陷检测模型;使用通用缺陷检测模型对待测程序进行预测,自定义目标缺陷类型,通用缺陷基于距离排名的缺陷预测方法进行预测。特定缺陷为人工确认预测结果,为待测程序添加标签并使用模型进行学习,强化模型预测能力。本发明有效解决了目前的基于机器学习的缺陷预测方法需要大量训练数据学习缺陷特征,无法预测不在训练集中的缺陷类型的问题。