-
公开(公告)号:CN118608915A
公开(公告)日:2024-09-06
申请号:CN202410598789.9
申请日:2024-05-15
Applicant: 电子科技大学长三角研究院(衢州) , 电子科技大学
Abstract: 本发明公开了一种空频结合的三支路对抗样本检测方法,通过对输入图片进行离散余弦变换,并结合Swin Transformer模块提取频域特征,能够捕捉到图片的频域信息,从而在检测过程中增加了模型对对抗样本的敏感度。其次,利用Swin Transformer从RGB三通道图片中提取深层空域特征,可以捕获到图片的全局和局部信息,提高了模型对图片的整体把握能力。第三,通过纹理增强模块获取图片的纹理特征,有助于模型对图片的细微纹理变化进行识别,从而增强了模型对对抗样本的检测能力。本发明的利用三支路分别提取图片的各种特征同时结合Swin Transformer网络,能够实现较高的对抗样本检测准确率以及较好的泛化性能,为后期计算机视觉任务处理模型的训练数据提供安全性保证。
-
公开(公告)号:CN118537651A
公开(公告)日:2024-08-23
申请号:CN202410714830.4
申请日:2024-06-04
Applicant: 电子科技大学长三角研究院(衢州) , 电子科技大学
IPC: G06V10/764 , G06V10/26 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/084
Abstract: 本发明公开一种基于相机指纹和自注意力机制融合的深度伪造检测方法,应用于深度伪造检测技术领域,针对原有图像的细节和特征被破坏的深度伪造图像,现有技术难以有效检测伪造内容的问题;本发明在训练阶段,通过块嵌入模块将图像划分为等大的小块,灰度化得到灰度图像,小波分解将图像分解为不同的子带,采用维纳滤波获得去噪后的小波系数,小波逆变换重新生成图像,然后原图像减去生成图像得到PRNU特征图,送入自注意力模块得到自注意力图,最后将得到的自注意力图与改进的EfficientNet B4网络的特征层融合,通过全局池化层得到当前输入内容的检测结果。
-
公开(公告)号:CN111027060B
公开(公告)日:2022-04-29
申请号:CN201911300484.0
申请日:2019-12-17
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于知识蒸馏的神经网络黑盒攻击型防御方法,其包括选取多个子网络构建教师网络,对所有子网络softmax层的输入向量进行软化,之后重新加载子网络的模型参数训练得到新的子网络;获取每个子网络的预测标签,并将所有预测标签平均或加权平均后做为软标签;将ImageNet数据集输入学生网络,采用软标签、数据集硬标签及黑盒模型特殊标签指导学生网络训练,得到替代模型;采用白盒攻击算法攻击替代模型生成对抗样本序列,并采用对抗样本序列对黑盒模型进行攻击,选取对抗样本序列中攻击成功的对抗样本;将攻击成功的对抗样本加入黑盒模型的训练集中,并采用更新后的训练集进行对抗训练,生成具备防御攻击的黑盒模型。
-
公开(公告)号:CN108924558B
公开(公告)日:2021-10-22
申请号:CN201810653610.X
申请日:2018-06-22
Applicant: 电子科技大学
IPC: H04N19/176 , H04N19/96 , H04N19/119 , H04N19/85 , H04N19/50 , G06N3/04 , G06K9/62
Abstract: 本发明公开了一种基于神经网络的视频预测编码方法,涉及视频压缩编码技术领域,本发明包括S1、输入大小为64×64的编码树单元,通过贝叶斯分类器对其进行粗判断,判断是否采用SKIP模式,若是,则判定当前编码树单元不往下划分,直接得到编码树单元的编码单元大小决策,否则,执行S2;S2、通过三支神经网络并行对编码树单元的深度进行编码单元分块决策,得到编码单元的分块结果;S3、由S2中得到的编码单元分块结果得到编码单元大小决策;S4、根据S1或S3中得到的编码单元大小决策进行预测编码,得到编码结果,本发明在确保编码性能的前提下,能够大大降低编码复杂度,提高编码效率。
-
公开(公告)号:CN108898610A
公开(公告)日:2018-11-27
申请号:CN201810810429.5
申请日:2018-07-20
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于mask-RCNN的物体轮廓提取方法,首先通过训练获得一个mask-RCNN模型,将待提取物体轮廓的RGB图像输入mask-RCNN模型进行语义分割,通过mask-RCNN网络处理得到RGB图像对应的二值掩膜图像,将RGB图像和对应的二值掩膜图像输入轮廓细化模块,提出了一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的二值掩膜图像轮廓进行自适应修正,最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取。
-
公开(公告)号:CN106960612A
公开(公告)日:2017-07-18
申请号:CN201710375620.7
申请日:2017-05-24
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于VR的看车和试驾模拟系统及方法,涉及看车和试驾模拟领域,本申请旨在解决VR在用户试车和试驾时候产生的交互无法量化而导致的交互效果不准确而导致的用户体验差的问题,本申请采用的技术方案为:在同一参考坐标系下基于采集终端模块采集人体骨骼信息以及获取汽车的控制信号以及场景信号以及人体位姿信号,并基于这些信号建立相应的驾驶视觉场景模型以及驾驶舱座椅模型,并将实时的这些信号输入模型生成相应的视觉场景效果以及触觉效果以及座椅变动效果。通过采用本方案,使得用户在使用VR进行试车或试驾过程的交互实现量化,同时实现了在同一坐标系下实现了试车与驾车,使得用户的体验更真实。本发明适用于VR的实际应用相关领域。
-
公开(公告)号:CN112464727A
公开(公告)日:2021-03-09
申请号:CN202011206986.X
申请日:2020-11-03
Applicant: 电子科技大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于光场相机的自适应人脸识别方法,包括以下步骤:通过光场相机采集原始图像,对原始图像进行光场再聚焦获取T张同一场景在不同位置的再聚焦图像;采用人脸检测算法对再聚焦图像进行人脸检测,得到初步人脸检测结果;对初步人脸检测结果进行人脸分组,得到同一人脸不同清晰程度的人脸图像序列;计算同一人脸不同清晰程度的人脸图像序列中每张图像的清晰度,获取每张人脸对应的清晰度最大的人脸图像;对清晰度最大的人脸图像进行人脸识别,完成基于光场相机的自适应人脸识别。本发明提出的基于光场相机的自适应人脸识别方法,提高了方法的自适应性,对环境依赖弱,能够适用于更多的识别场景。
-
公开(公告)号:CN108898610B
公开(公告)日:2020-11-20
申请号:CN201810810429.5
申请日:2018-07-20
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于mask‑RCNN的物体轮廓提取方法,首先通过训练获得一个mask‑RCNN模型,将待提取物体轮廓的RGB图像输入mask‑RCNN模型进行语义分割,通过mask‑RCNN网络处理得到RGB图像对应的二值掩膜图像,将RGB图像和对应的二值掩膜图像输入轮廓细化模块,提出了一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask‑RCNN获得的二值掩膜图像轮廓进行自适应修正,最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取。
-
公开(公告)号:CN107194964B
公开(公告)日:2020-10-09
申请号:CN201710375619.4
申请日:2017-05-24
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于实时人体三维重建的VR社交系统及其方法,涉及三维重建技术、虚拟现实社交实现技术领域,解决现有技术VR社交活动中由于用户配带头显遮挡了脸部导致的人体三维重建时无法实时生成脸部点云等技术问题。本发明不仅能让每个社交对象通过人体定位自由控制自己在虚拟场景中的位置,也能让每个社交对象通过位姿自由控制自己在头显中看到的视角,还能通过实时人体三维重建看到自己和其他社交对象。本发明用于VR社交、会议、游戏以及医学研究等领域。
-
公开(公告)号:CN107105333A
公开(公告)日:2017-08-29
申请号:CN201710283942.9
申请日:2017-04-26
Applicant: 电子科技大学
IPC: H04N21/426 , H04N21/44 , H04N21/472 , H04N21/485 , H04N21/81 , H04N5/265
CPC classification number: H04N21/42653 , H04N5/265 , H04N21/44008 , H04N21/47205 , H04N21/4854 , H04N21/816
Abstract: 本发明提供一种基于视线追踪技术的VR视频直播交互方法及装置,涉及视线交互技术、语音交互技术与VR视频压缩编码技术领域,通过眼球追踪技术判断人眼注视点,就可以在画面压缩编码过程中以高分辨率传输注视点区域,即感兴趣区域(ROI,region of interest),这样既保证了看到的画面足够清晰,又大幅度降低了传输的数据量,从而降低VR设备对硬件的要求。同时利用语音识别技术,可随时切换控制方式,增加了交互方式的多样性。
-
-
-
-
-
-
-
-
-