基于主动感知机制的行为识别方法、装置、设备及介质

    公开(公告)号:CN117935356A

    公开(公告)日:2024-04-26

    申请号:CN202311865794.3

    申请日:2023-12-29

    摘要: 本发明涉及行为识别技术领域,提供一种基于主动感知机制的行为识别方法、装置、设备及介质,所述方法包括:获取待识别的视频图像输入到经过预训练的行为识别模型中;利用行为识别模型对视频图像中各目标人物的行为进行识别;其中,行为识别模型包括主动感知机制网络和特征融合层,主动感知机制网络包括用于提取空间语义信息的审视分支和用于提取运动信息的浏览分支;特征融合层用于对空间语义信息和运动信息进行融合,得到融合特征用于行为识别。通过引入多分支网络和时空自注意力机制提取视频图像的特征信息并进行特征融合,使得模型具备对多个时间序列信息的分析能力,同时提高对视频中关键区域的关注能力,从而提高行为识别的性能。

    低光图像增强模型的训练方法和低光图像增强方法

    公开(公告)号:CN115984121A

    公开(公告)日:2023-04-18

    申请号:CN202211468704.2

    申请日:2022-11-22

    IPC分类号: G06T5/00 G06N3/08 G06N3/0464

    摘要: 本发明涉及图像处理技术领域,尤其涉及一种低光图像增强模型的训练方法和低光图像增强方法。其中,低光图像增强模型的训练方法包括,在训练低光图像增强模型,可以先获取多个低光图像样本,以及各个低光图像样本对应的正常光图像;将多个低光图像样本输入到初始低光图像增强模型中,得到各个低光图像样本对应的预测增强图像;根据各个低光图像样本对应的正常光图像和所述预测增强图像,对初始低光图像增强模型的模型参数进行更新,以得到训练后的低光图像增强模型。这样通过深度学习使得训练得到的低光图像增强模型,可以获取到效果较好的增强图像,使得得到的增强图像细节可视性较高。

    换脸方法、装置、电子设备和存储介质

    公开(公告)号:CN112734634B

    公开(公告)日:2021-07-27

    申请号:CN202110337402.0

    申请日:2021-03-30

    摘要: 本发明提供一种换脸方法、装置、电子设备和存储介质,其中方法包括:确定源人脸图像和目标人脸图像;将源人脸图像和目标人脸图像输入至人脸生成器中,得到人脸生成器输出的换脸图像;人脸生成器是基于样本图像对,与人脸判别器对抗训练得到的,人脸判别器用于对样本图像对及其样本换脸图像进行真伪判别,样本换脸图像是人脸生成器基于样本图像对进行换脸得到的。本发明提供的方法、装置、电子设备和存储介质,结合人脸判别器训练所得的人脸生成器,具有较强的泛化性能,可以适配任意人脸图像,无身份限制。且人脸生成器的训练样本也不需要大量相同身份的人脸图像,能够有效降低样本获取难度和获取成本,进一步提高换脸方法的适用范畴。

    换脸方法、装置、电子设备和存储介质

    公开(公告)号:CN112734634A

    公开(公告)日:2021-04-30

    申请号:CN202110337402.0

    申请日:2021-03-30

    摘要: 本发明提供一种换脸方法、装置、电子设备和存储介质,其中方法包括:确定源人脸图像和目标人脸图像;将源人脸图像和目标人脸图像输入至人脸生成器中,得到人脸生成器输出的换脸图像;人脸生成器是基于样本图像对,与人脸判别器对抗训练得到的,人脸判别器用于对样本图像对及其样本换脸图像进行真伪判别,样本换脸图像是人脸生成器基于样本图像对进行换脸得到的。本发明提供的方法、装置、电子设备和存储介质,结合人脸判别器训练所得的人脸生成器,具有较强的泛化性能,可以适配任意人脸图像,无身份限制。且人脸生成器的训练样本也不需要大量相同身份的人脸图像,能够有效降低样本获取难度和获取成本,进一步提高换脸方法的适用范畴。

    关键点定位方法
    6.
    发明授权

    公开(公告)号:CN106991388B

    公开(公告)日:2020-04-21

    申请号:CN201710191274.7

    申请日:2017-03-27

    IPC分类号: G06K9/00 G06N3/08

    摘要: 一种关键点定位方法,包括以下步骤:输入图片,采用预训练的全卷积网络获取图片中感兴趣物体的每个关键点的响应图;基于每个关键点的响应图,采用预训练的点分布模型获取每个关键点的初始定位;基于加权约束均值漂移方法,迭代调整每个关键点的定位,最后得到每个关键点的最终定位。本发明将数据驱动的表达能力及模型驱动的先验推理能力有机地结合起来,其使用的全卷积网络能有效应对图片中物体的刚性及非刚性变换,点分布模型能有效应对图片中存在的遮挡情况,加权约束均值漂移能合理地权衡前两者的作用,从而极大地提高了关键点定位的鲁棒性。

    人脸防伪识别方法及装置

    公开(公告)号:CN117854159B

    公开(公告)日:2024-09-03

    申请号:CN202311714485.6

    申请日:2023-12-13

    摘要: 本发明提供一种人脸防伪识别方法及装置,该方法包括:基于生成器,生成第一人脸图像样本的干扰图像,所述生成器基于第二人脸图像样本与所述第二人脸图像样本的干扰图像之间的聚类对比损失值、类别损失值和语义损失值进行权值调整得到,所述第二人脸图像样本的干扰图像基于所述生成器生成;基于所述第一人脸图像样本、所述第一人脸图像样本的干扰图像和所述第一人脸图像样本的人脸伪造类型标签,对分类器进行训练;基于训练后的所述分类器,确定目标人脸图像的人脸伪造类型预测值。本发明实现降低训练成本,提高识别精度。

    高分辨率人脸图像的多属性编辑方法、系统、装置

    公开(公告)号:CN111145311B

    公开(公告)日:2021-11-26

    申请号:CN201911391946.4

    申请日:2019-12-30

    摘要: 本发明属于模式识别、计算机视觉及数字图像处理领域,具体涉及了一种高分辨率人脸图像的多属性编辑方法、系统、装置,旨在解决现有技术无法实现高分辨率、可控的多属性人脸图像编辑的问题。本发明包括:通过多属性编辑网络的编码器获取输入图像的特征表达;将原始标签集合中待编辑的标签调整为预设的目标标签;将调整后的标签集合后扩展为图像特征空间分辨率大小后与图像特征表达组合;基于组合后的特征表达,通过多属性编辑网络的解码器获取输入图像对应的属性编辑后的图像。本发明利用小波变换获取图像的高频和低频信息,结合加权约束属性类别的策略以及基于属性映射的重建学习,可编辑高分辨率人脸图像,同时可实现可控的多属性人脸图像编辑。

    基于深度学习的眼白图像超分辨率重建与图像增强方法

    公开(公告)号:CN107944379B

    公开(公告)日:2020-05-15

    申请号:CN201711158278.1

    申请日:2017-11-20

    摘要: 本公开提供了一种基于深度学习的眼白图像超分辨率重建与图像增强的方法,包括:步骤S1,采集人脸视频、帧采样获取人脸图像;步骤S2,通过人脸图像提取双眼区域,关键点定位分割左右眼白,获得眼白图像;步骤S3,利用深度学习对眼白图像做超分辨率重建,获得高分辨率眼白图像;步骤S4,对高分辨率眼白图像做真彩色图像增强。本公开通过训练卷积神经网络(CNN)结合递归神经网络(RNN),可识别眼白血管纹理特征、提高图像分辨率,再结合图像增强技术进一步将眼白血管纹理清晰的呈现出来,大大提高个人身份识别的准确率。