一种基于最小化多支路网络旋转方差的跨域视线预测方法、装置、电子设备及存储介质

    公开(公告)号:CN120071422A

    公开(公告)日:2025-05-30

    申请号:CN202510050507.6

    申请日:2025-01-13

    Abstract: 本发明公开了一种基于最小化多支路网络旋转方差的跨域视线预测方法,包括以下步骤:将源域图像进行光照变换,得到源域输入图像集;将源域输入图像集输入初始的视线预测网络,对初始的视线预测网络的参数进行更新,得到预训练的视线预测网络;将目标域图像进行光照变换图像和对应的原图像输入预训练的视线预测网络,对预训练的视线预测网络进行训练,得到预测目标视线预测网络;将目标域图像输入预测目标视线预测网络,根据输出的预测结果确定预测目标视线。本发明可以提取更加鲁棒的视线特征,减小了模型不确定性,可以在少量无标签的目标域数据进行更好的自适应,提高了跨域视线估计的精度。

    一种基于注意力机制的跨域视线估计方法和装置

    公开(公告)号:CN120014689A

    公开(公告)日:2025-05-16

    申请号:CN202510050505.7

    申请日:2025-01-13

    Abstract: 本发明公开了一种基于注意力机制的跨域视线估计方法和装置,该跨域视线估计方法包括步骤:获取源域样本数据集和目标域样本数据集;构建基于注意力机制的深度学习网络模型;将源域样本数据集输入到深度学习网络模型中,对深度学习网络模型迭代训练,得到训练后深度学习网络模型;将目标域样本数据集输入到训练后深度学习网络模型中,获取视线预估结果。本发明在主干网络的基础上,嵌入了两个通道注意力模块,并通过视线预测模块和图像重建模块两个任务分支进行约束,帮助网络提高对与视线估计任务有关的特征的提取能力,从而提高网络模型的泛化能力。

    基于多尺度特征的表情识别方法、装置及设备

    公开(公告)号:CN118692127A

    公开(公告)日:2024-09-24

    申请号:CN202410820460.2

    申请日:2024-06-24

    Abstract: 本发明涉及一种基于多尺度特征的表情识别方法、装置及设备,该方法包括:将预处理后的待识别图像输入预先训练的表情识别模型;通过预先训练的表情识别模型得到待识别图像在多个不同尺度下的特征;根据多个不同尺度下的待识别图像得到待识别图像的表情识别结果。通过上述技术方案,通过在表情识别模型获取待识别图像的多尺度特征,使模型能够提取到更具判别性、泛化性的特征,由于不同尺度的特征网络所关注的位置与范围都不同,因此本发明中的表情识别模型还可以根据不同尺度下的特征进行表情识别,能够在各种复杂环境中使用,具有较好的适应性和较好的识别结果。

Patent Agency Ranking