-
公开(公告)号:CN117975576A
公开(公告)日:2024-05-03
申请号:CN202410119338.2
申请日:2024-01-29
Applicant: 华南理工大学
IPC: G06V40/40 , G06V40/16 , G06V20/40 , G06V10/25 , G06V10/44 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于原型学习和余弦相似度的特征聚类人脸欺诈检测方法及系统,该方法包括下述步骤:视频预处理,基于潜在分布骨干网络提取潜在分布特征,对潜在分布特征和原型中心进行归一化并计算两者的余弦相似度;对同一个类别的所有原型中心余弦相似度加权求和得到对应类别的分类预测角度余弦;计算带有边缘惩罚系数的加性角度损失函数;基于类间损失函数和类内损失函数计算各个原型中心的距离;基于构建的总损失函数训练得到预测模型;根据各个原型中心周围样本密度对原型中心个数进行调整,优化预测模型;基于优化后的预测模型输出测试人脸欺诈检测结果。本发明保证了模型对人脸欺诈视频特征的提取能力和鉴别能力,提高了模型的泛化能力。
-
公开(公告)号:CN110728308B
公开(公告)日:2024-04-05
申请号:CN201910909431.2
申请日:2019-09-25
Applicant: 华南理工大学
IPC: G06F18/2411 , G10L13/04 , G10L15/22 , G10L15/26
Abstract: 本发明属于计算机视觉与语音识别技术领域,涉及一种基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、数据处理和信号传递,其上部署有交互式导盲系统的控制软件,包括:目标检测单元、语音识别单元和道路规划单元;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本发明能辅助盲人更好地生活,提高盲人的生活质量。
-
公开(公告)号:CN110728308A
公开(公告)日:2020-01-24
申请号:CN201910909431.2
申请日:2019-09-25
Applicant: 华南理工大学
Abstract: 本发明属于计算机视觉与语音识别技术领域,涉及一种基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、数据处理和信号传递,其上部署有交互式导盲系统的控制软件,包括:目标检测单元、语音识别单元和道路规划单元;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本发明能辅助盲人更好地生活,提高盲人的生活质量。
-
公开(公告)号:CN211512572U
公开(公告)日:2020-09-18
申请号:CN201921601724.6
申请日:2019-09-25
Applicant: 华南理工大学
IPC: A61H3/06
Abstract: 本实用新型属于导盲系统技术领域,涉及一种交互式导盲系统。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、目标检测、路径规划、语音识别和信号传递;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本实用新型能辅助盲人更好地生活,提高盲人的生活质量。(ESM)同样的发明创造已同日申请发明专利
-
-
-