-
公开(公告)号:CN112733724A
公开(公告)日:2021-04-30
申请号:CN202110035353.5
申请日:2021-01-12
申请人: 清华大学
摘要: 本发明提出一种基于判别样本元挖掘器的亲属关系验证方法和装置,其中,方法包括:根据第一正负样本比例获取第一正负样本对图像;根据第一正负样本对图像对亲属关系模型执行一次虚拟更新得到更新后的候选亲属关系模型;使用第二正负样本比例获取第二正负样本对图像;根据第二正负样本对图像对更新元挖掘网络的网络参数,得到目标元挖掘网络;将第一正负样本对图像中的每对正负样本对图像输入目标元挖掘网络,获取每对正负样本对图像的样本权重;根据样本权重训练候选亲属关系模型得到目标亲属关系模型,以便于根据目标亲属关系模型识别图像之间的亲属关系。由此,解决了亲属验证数据集与生俱来的数据不平衡问题。
-
公开(公告)号:CN112613617A
公开(公告)日:2021-04-06
申请号:CN202011612532.2
申请日:2020-12-30
申请人: 清华大学
摘要: 本申请提出一种基于回归模型的不确定性估计方法和装置,涉及机器学习技术领域,其中,方法包括:获取输入样本,并提取输入样本的概率分布特征;其中,输入样本具有标签值;从概率分布特征中采样T个特征;其中T为正整数;获取T个特征对应的T个损失函数,并对T个损失函数进行处理,获取训练损失函数;将输入样本输入回归模型进行处理,获取预测值,并通过训练损失函数根据标签值和预测值对回归模型的参数进行调整,获取已训练回归模型,以使将待处理数据输入已训练回归模型,获取回归结果和目标值。由此,可以给出每一个测试数据的不确定性,即目标值,同时在建模不确定性中有效提高了回归结果的准确性,得到一个性能更好的回归模型。
-
公开(公告)号:CN112733724B
公开(公告)日:2022-07-26
申请号:CN202110035353.5
申请日:2021-01-12
申请人: 清华大学
IPC分类号: G06V40/16 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04
摘要: 本发明提出一种基于判别样本元挖掘器的亲属关系验证方法和装置,其中,方法包括:根据第一正负样本比例获取第一正负样本对图像;根据第一正负样本对图像对亲属关系模型执行一次虚拟更新得到更新后的候选亲属关系模型;使用第二正负样本比例获取第二正负样本对图像;根据第二正负样本对图像对更新元挖掘网络的网络参数,得到目标元挖掘网络;将第一正负样本对图像中的每对正负样本对图像输入目标元挖掘网络,获取每对正负样本对图像的样本权重;根据样本权重训练候选亲属关系模型得到目标亲属关系模型,以便于根据目标亲属关系模型识别图像之间的亲属关系。由此,解决了亲属验证数据集与生俱来的数据不平衡问题。
-
公开(公告)号:CN114565017A
公开(公告)日:2022-05-31
申请号:CN202210082013.2
申请日:2022-01-24
申请人: 清华大学
摘要: 本申请涉及人工智能计算机视觉技术领域,特别涉及一种基于标签到标签的多属性预测方法、装置、设备及介质,其中,方法包括:提取图像数据的深度特征;基于深度特征获取图片数据的伪标签序列;将伪标签序列中的每个单词以预设概率进行掩码,获取被遮挡的句子,并由被遮挡的句子恢复得到完整的句子,学习多个属性之间的关联关系,生成最终多属性预测结果。由此,解决了多任务学习的框架中无法在一个视觉样本中建模多个属性标签值之间的关联关系,导致性能较差等问题,通过预测被遮挡的多个属性标签值来建模多个属性之间的关联关系,提升多属性预测的性能,从而有效的提升模型的准确率。
-
公开(公告)号:CN109886183B
公开(公告)日:2021-01-12
申请号:CN201910121339.X
申请日:2019-02-19
申请人: 清华大学
摘要: 本发明公开了一种基于桥式神经网络的人脸年龄估计方法及装置,其中,该方法包括:获取待估计输入图片;根据输入图片通过人脸检测技术获取人脸区域与人脸的多个关键点;根据多个关键点进行人脸对齐,以获取对齐后的人脸图片;将对齐后的人脸图片输入到深度卷积神经网络中进行特征提取,并将在进行特征提取的全连接层连接到桥式网络的局部回归器和门网络,生成回归结果和门函数,对回归结果和门函数进行加权和得到年龄估计结果。该方法可以解决现有年龄估计中低准确率问题,利用感知连续性的桥式网络,使得局部回归器间的连续性关系得到显式建模,从而充分利用这一信息提升最终的年龄估计性能,提升准确率。
-
公开(公告)号:CN112766421A
公开(公告)日:2021-05-07
申请号:CN202110272409.9
申请日:2021-03-12
申请人: 清华大学
摘要: 本申请提出一种基于结构感知的人脸聚类方法和装置,其中,该方法包括:获取多个待处理人脸图像,并基于预先训练的卷积神经网络模型提取每个所述待处理人脸图像的人脸特征,并根据每个所述待处理人脸图像的人脸特征构建K近邻图;将所述K近邻图输入至预先训练的边分数预测模型,获得所述K近邻图之中各边的分数;其中,所述边分数预测模型是利用结构保留子图采样策略对K近邻图进行采样,并利用采样得到的子图对图卷积神经网络进行训练而得到的;根据所述K近邻图之中各边的分数,对所述K近邻图进行第一次剪枝操作,获得针对所述多个待处理人脸图像的人脸聚类。解决相关技术中人脸聚类准确度不足的技术问题。
-
公开(公告)号:CN112766421B
公开(公告)日:2024-09-24
申请号:CN202110272409.9
申请日:2021-03-12
申请人: 清华大学
IPC分类号: G06V40/16 , G06V10/762 , G06V10/82 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本申请提出一种基于结构感知的人脸聚类方法和装置,其中,该方法包括:获取多个待处理人脸图像,并基于预先训练的卷积神经网络模型提取每个所述待处理人脸图像的人脸特征,并根据每个所述待处理人脸图像的人脸特征构建K近邻图;将所述K近邻图输入至预先训练的边分数预测模型,获得所述K近邻图之中各边的分数;其中,所述边分数预测模型是利用结构保留子图采样策略对K近邻图进行采样,并利用采样得到的子图对图卷积神经网络进行训练而得到的;根据所述K近邻图之中各边的分数,对所述K近邻图进行第一次剪枝操作,获得针对所述多个待处理人脸图像的人脸聚类。解决相关技术中人脸聚类准确度不足的技术问题。
-
公开(公告)号:CN114782596A
公开(公告)日:2022-07-22
申请号:CN202210185835.3
申请日:2022-02-28
申请人: 清华大学
摘要: 本申请涉及计算机视觉技术领域,特别涉及一种语音驱动的人脸动画生成方法、装置、设备及存储介质,其中,方法包括:基于任一查询视角与多张参考图像,提取任一查询视角下对应的图像特征;逐帧提取音频的初始音频特征,并对音频特征进行时序滤波,获取满足帧间平滑条件的音频特征;利用图像特征和音频特征驱动动态人脸神经辐射场,并在体素渲染后,获取当前帧的生成图像。由此,解决了现有语音驱动的人脸动画合成方法的低泛化性问题,通过提出基于少样本学习的动态人脸辐射场,来更加准确地建模动态人脸,并通过参考图像机制实现少样本学习,提升模型泛化性。
-
公开(公告)号:CN109886183A
公开(公告)日:2019-06-14
申请号:CN201910121339.X
申请日:2019-02-19
申请人: 清华大学
摘要: 本发明公开了一种基于桥式神经网络的人脸年龄估计方法及装置,其中,该方法包括:获取待估计输入图片;根据输入图片通过人脸检测技术获取人脸区域与人脸的多个关键点;根据多个关键点进行人脸对齐,以获取对齐后的人脸图片;将对齐后的人脸图片输入到深度卷积神经网络中进行特征提取,并将在进行特征提取的全连接层连接到桥式网络的局部回归器和门网络,生成回归结果和门函数,对回归结果和门函数进行加权和得到年龄估计结果。该方法可以解决现有年龄估计中低准确率问题,利用感知连续性的桥式网络,使得局部回归器间的连续性关系得到显式建模,从而充分利用这一信息提升最终的年龄估计性能,提升准确率。
-
-
-
-
-
-
-
-