-
公开(公告)号:CN119296159A
公开(公告)日:2025-01-10
申请号:CN202411512523.4
申请日:2024-10-28
Applicant: 广州广电卓识智能科技有限公司 , 华南理工大学 , 深圳市创自技术有限公司
Abstract: 本申请公开了一种基于图文对比辅助学习的人脸反欺诈模型训练方法及装置,属于人工智能技术领域。方法包括:对图像集中各个样本图像的内容进行识别,得到各个样本图像对应的描述文本;结合描述文本和标签生成各个样本图像对应的文本数据;将图像集中各个样本图像输入至多模态预训练模型中的图像编码器,以及将各个图像对应的文本数据输入至多模态预训练模型中的文本编码器,以对多模态预训练模型进行训练,得到人脸反欺诈模型。上述方法,整合了图像内容描述文本和人脸类型标签,并且对特征进行混合,引入中心差分卷积适配器模块以捕捉人脸的细微特征,采用图文比对学习和匹配对特征进行语义对齐,提高了模型在不同应用场景下的泛化能力。
-
公开(公告)号:CN114863497B
公开(公告)日:2024-12-24
申请号:CN202210416195.2
申请日:2022-04-20
Applicant: 华南理工大学
IPC: G06V40/14 , G06V10/44 , G06V10/764 , G06N3/0455 , G06N3/09 , G06N3/0464
Abstract: 本发明公开了一种基于Transformer的静脉认证方法,包括以下步骤:S1、将静脉图像进行预处理;S2、将预处理后的静脉图像输入基于Transformer的静脉认证模型进行特征提取,输出待认证的静脉图像的特征;S2、将待认证的静脉图像的特征与样本库里的静脉特征做相似度度量,大于设置的阈值时则认为认证成功。本发明将金字塔分层结构引入视觉Transformer模型中,不仅具有参数量少、计算速度快的优点,还有利于提取静脉图像的多层级特征,从而使得提取到的静脉特征更具有表达力。
-
公开(公告)号:CN114220129B
公开(公告)日:2024-08-16
申请号:CN202111290850.6
申请日:2021-11-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于掌纹和手势融合识别的身份认证方法及控制设备,包以下步骤:S1、用户选择进入注册模式输入用户名开启注册,采集设备分别采集用户不同的手掌信息和手势动作信息特征,将提取到特征存入处理器与注册用户名相对应;S2、用户对每个手掌信息和手势动作特征设置绑定相应的权限;S3、用户认证时,将手扫过图像采集区域并做出与注册时相同的手掌或者手势动作,采集设备采集图像,将采集的图像输入系统进行特征提取,将得到的特征信息与注册过的用户特征信息进行比对,相似度达到阈值则提示认证成功,开启相应的权限,循环步骤S3开启以下一个权限的采集和认证。
-
公开(公告)号:CN118411465A
公开(公告)日:2024-07-30
申请号:CN202410424788.2
申请日:2024-04-10
Applicant: 华南理工大学
IPC: G06T17/00 , G06N3/0455 , G06N3/084 , G06N3/0464
Abstract: 本发明提供了一种基于误差感知的多视图三维重建方法、介质及设备;其中方法为:获取多视图图像;提取出K种不同尺度的多视图特征;采用包括K个阶段的深度预测模型分别对多视图特征进行处理;每个阶段对应一种尺度的多视图特征;各个阶段的分步骤分别包括可微分单应变换、代价体聚合、代价体正则化和深度回归;基于最后一个阶段得到的预测深度图,完成三维重建。该方法采用误差感知深度表示,将深度信息解耦为相对于深度假设平面的置信度和偏移量,并关注于不同的深度假设平面的挖掘与利用,使得模型具备误差感知能力以进行更为精确的深度估计,进而得到更为准确且完整的三维场景表示。
-
公开(公告)号:CN118332447A
公开(公告)日:2024-07-12
申请号:CN202410439753.6
申请日:2024-04-12
Applicant: 华南理工大学
IPC: G06F18/2431 , A61B5/346 , A61B5/00 , G06F18/15 , G06F18/213 , G06F18/25 , G06N3/0464 , G06N3/0455 , G06N3/084 , G16H50/20
Abstract: 本发明公开了一种基于心电图的预激旁道自动定位方法及系统,在预激旁道自动定位方法AI模型的训练阶段,批次数量为N的样本数据经过EfficientNet‑b1‑sk骨干特征提取网络后得到N个输出特征向量,然后流向两个分支。一个分支经过批处理模块后再经过分类器即全连接层处理获得AI模型的预测输出,这一分支可以通过梯度反向传播学习得到样本之间的相互关系,解决类别不平衡分布带来的尾部类预测准确率低的问题;另一分支之间输出到分类器获得AI模型的预测结果,两个分支同时训练的过程中,AI模型能通过梯度反向传播过程将批样本处理模块获得的样本相互关系知识转移到骨干特征网络和分类器上,使AI模型获得更好的分类性能。
-
公开(公告)号:CN117765578A
公开(公告)日:2024-03-26
申请号:CN202311594133.1
申请日:2023-11-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于掌静脉模式定制的轻量化认证网络的认证方法,包括以下步骤:掌静脉感兴趣区域ROI图片通过在线数据增强方法丰富掌静脉ROI图片姿态变化和灰度变化的多样性;建立基于深度可分离卷积模块的卷积神经网络结构,并训练该建立的卷积神经网络,通过基于深度可分离卷积模块的卷积神经网络结构提取掌静脉特征;在认证时,去除在线数据增强和损失函数计算部分完成掌静脉特征的提取,将提取的特征与注册掌静脉特征库中的所有特征依次计算余弦相似度,当该相似度数值大于设置的阈值时则认为认证成功。
-
公开(公告)号:CN117457027A
公开(公告)日:2024-01-26
申请号:CN202311414746.2
申请日:2023-10-30
Applicant: 华南理工大学
Abstract: 本发明提供了一种梅尔频谱时域融合的工业机器设备声音辨认方法、介质及设备;该方法为:采集工业机器设备声音的音频信号;对音频信号进行短时傅里叶变换与梅尔滤波器组滤波得到梅尔频谱;对音频信号进行一维卷积与多个卷积‑归一化‑激活模块得到时域特征;将梅尔频谱与时域特征拼接得到初级特征;对初级特征进行特征变换得到高级特征嵌入码;输入分类器从而得到对工业机器设备声音的辨认结果。该方法融合梅尔频谱与时域特征,充分利用了工业机器设备声音的全频段信息,可提高工业机器设备声音不同状态下的辨认结果准确率,有利于对工业机器设备的运行状态进行有效诊断。
-
公开(公告)号:CN116912763A
公开(公告)日:2023-10-20
申请号:CN202310772978.9
申请日:2023-06-28
Applicant: 华南理工大学
IPC: G06V20/52 , G06V20/40 , G06V40/16 , G06V40/20 , G06V10/26 , G06V10/774 , G06V10/25 , G06V10/28 , G06V10/44 , G06V10/80
Abstract: 本发明公开了一种融合步态人脸模态的多行人重识别方法,利用深度神经网络提取行人表征信息的同时,还融合步态以及人脸模态识别的信息对不同视角的行人身份进行检索,使得出现行人图像的分辨率低、监控环境发送变化或者行人部位受到遮挡的情况下,能最大限度地提高行人识别的精度。
-
公开(公告)号:CN116665319A
公开(公告)日:2023-08-29
申请号:CN202310944402.6
申请日:2023-07-31
Applicant: 华南理工大学
IPC: G06V40/70 , G06N20/20 , G06V10/762 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明涉及数据融合处理技术领域,提供了一种基于联邦学习的多模态生物特征识别方法。该方法包括:将初始模型发送至多个参与方,各个参与方利用自身训练数据对初始模型训练后形成本地初始模型;服务器将个各模型的参数进行聚类,抽取每一簇内的多个参与方,参与方利用本地数据训练本地初始模型,将本地初始模型与服务方簇内的模型进行参数汇聚;服务方对同模态模型组按照不同的模态进行融合生成可互补多模态模型组;服务方将可互补多模态模型组的多模态模型互补的发送到参与方,同时将同模态模型发互补的发给参与方;参与方采用多模态模型分数融合的方法,将本地初始模型、同模态模型和多模态模型进行融合形成参与方所需的多模态融合模型。
-
公开(公告)号:CN113076891B
公开(公告)日:2023-08-22
申请号:CN202110382970.2
申请日:2021-04-09
Applicant: 华南理工大学
IPC: G06V40/10 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于改进高分辨率网络的人体姿态预测方法及系统,该方法包括以下步骤:图像获取步骤:获取环境图像;姿态关键点预测步骤:将环境图像输入到姿态关键点预测模型中确定每个目标的姿态关键点得分热力图,其中姿态关键点预测模型为使用多组数据通过机器学习训练得出,多组数据中的每组数据包括环境图像和标识该环境图像中人的姿态关键点的标签,姿态关键点预测模型基于高分辨率网络结合粗预测损失得到;人体姿态解码步骤:基于姿态关键点的得分热力图结算形成人体姿态预测线,将人体姿态预测线映射在环境图像中得到人体姿态预测图像。本发明通过引入肢体损失约束深层神经网络学习相连节点的关系,提高了对姿态关键点的预测准确性。
-
-
-
-
-
-
-
-
-