基于人工智能的说话人识别方法及装置、系统
摘要:
本发明涉及图像处理技术领域,具体而言,涉及一种基于人工智能的说话人识别方法及装置、系统以及电子设备。所述识别方法包括:获取待检测图像并对其进行人脸识别处理以获取至少一个人脸坐标;识别待检测图像中的音频采集设备,以获取音频采集设备的第一坐标数据;根据音频采集设备的第一坐标数据与历史坐标数据计算位移数据,以根据位移数据计算音频采集设备的精确坐标;计算精确坐标与所述至少一个人脸坐标之间的物间距离,并将具有最小物间距离的人脸坐标对应的对象作为说话人。本发明的技术方案在确定待检测图像中的人脸以及唯一的音频采集设备后,可结合历史坐标数据对音频采集设备坐标的正确性进行判断并优化,提升说话人识别的精确度。
公开/授权文献
0/0