-
公开(公告)号:CN113222167A
公开(公告)日:2021-08-06
申请号:CN202010081349.8
申请日:2020-02-06
Applicant: 浙江大学
Abstract: 本申请公开了一种图像处理方法及其装置,所述方法包括:获取待处理的第一图像;将第一图像输入到已训练完成的图像处理机器学习模型中,获取第一图像在预设属性下的属性特征向量,其中,所述图像处理机器学习模型利用预先获取的训练图像集以及每个训练图像对于所述预设属性的标注信息进行训练得到。采用本申请,可获取到图像在特定属性下的特征信息,从而能够更好地反映图像的局部细节。
-
公开(公告)号:CN117854039A
公开(公告)日:2024-04-09
申请号:CN202311758543.5
申请日:2023-12-20
Applicant: 浙江大学
IPC: G06V20/58 , G06V10/764 , G06V10/82 , G06V10/40 , G06V10/54 , G06V10/26 , G06V10/32 , G06T17/20 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 本发明提供了一种面向车辆目标检测模型的对抗样本生成方法和端到端对抗训练系统,本发明通过控制摄像头视角、天气状态等参数,生成多样化的自动驾驶场景数据,再基于神经渲染器绘制并优化物理可部署的对抗纹理,得到对抗样本,实现多视角下的有效攻击;可以将优化的纹理张贴到车辆表面,实现物理世界的评估与检测;且具有良好的泛化性,能够干扰不同的目标检测模型,可以提升其鲁棒性。发明还通过预置若干超参数控制交通流特征,设计脚本实现自动化训练。针对识别效果不佳的样本,系统会提取其对应的拍摄参数特征,在下一个轮次生成更多的类似样本,实现自适应的流水线训练过程,定向优化模型的薄弱环节,极大地减少了训练开销。
-
公开(公告)号:CN116721321A
公开(公告)日:2023-09-08
申请号:CN202310625066.9
申请日:2023-05-30
Applicant: 浙江大学
IPC: G06V10/80 , G06V10/40 , G06V10/75 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于多尺度特征融合的源相机识别方法和装置,包括以下步骤:基于多尺度特征融合构建溯源模型,包括多尺度特征提取模块和特征融合模块以及分类器;利用训练图像集对溯源模型进行监督学习,提取监督学习后的多尺度特征提取模块和特征融合模块组成特征提取器;利用特征提取器提取测试图像集中每个测试图像的高维向量,并以高维向量为测试图像对应源相机类别的指纹索引,构建相机指纹库;利用特征提取器提取待测图像的高维向量,基于高维向量与相机指纹库中的指纹索引进行匹配检索,基于匹配检索的指纹索引得到待测图像的源相机类别。该方法和装置能够在保证溯源精度的情况下实现高效源相机识别。
-
公开(公告)号:CN101986175A
公开(公告)日:2011-03-16
申请号:CN201010523965.0
申请日:2010-10-29
Applicant: 浙江大学
Abstract: 本发明公开了一种芯片集成式金属纳米线的表面等离子体激发方法,该方法将金属纳米线放置于激光二极管芯片的出光面,激发表面等离子体在金属纳米线中传输。本发明使得光源与等离子体波导直接在芯片上集成,从而省去了传统表面等离子体激发方法中的透镜、棱镜等耦合装置,该结构中金属纳米线的输出为线偏振光,可通过调节纳米线的方向调节光强输出。
-
公开(公告)号:CN119478094A
公开(公告)日:2025-02-18
申请号:CN202411566591.9
申请日:2024-11-04
Applicant: 浙江大学
IPC: G06T11/00 , G06T5/70 , G06T5/60 , G06F16/334 , G06N3/0455 , G06N3/08
Abstract: 本发明提供的基于逆向的文生图扩散模型的记忆问题的度量方法,相比于现有的度量方法而言,该方法基于给定一个预训练的文生图扩散模型和一个任意图像,构建加权的目标函数,逆向输出一个提示文本分布和一个噪声分布,解决了以往基于随机生成图像检测图像相似内容来评估记忆问题所带来的随机性影响;通过定义噪声分布的敏感度来构建记忆问题的度量指标函数,对图像生成模型的记忆问题进行连续准确地度量,给出任一张图像记忆风险的量化结果,审计图像生成模型的记忆风险。本发明还提供了基于逆向的文生图扩散模型的记忆问题的度量设备,实现图像记忆问题的度量方法。
-
公开(公告)号:CN112860930B
公开(公告)日:2022-09-16
申请号:CN202110185623.0
申请日:2021-02-10
Applicant: 浙江大学
IPC: G06F16/532 , G06F16/583 , G06V10/40 , G06V10/74 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于层次化相似性学习的文本到商品图像的检索方法,该方法通过预训练的目标检测模型和利用独热编码以及预训练的Word2Vec获取图像和文本的初步特征,再通过两个层次化编码网络分别对两种模态进行层次化编码。通过全连接层将特征映射到一个统一公共空间中,进行两种不同粒度的相似性度量,分别是物体粒度的相似性和图像粒度的相似性,最后利用公共空间算法学习两个模态之间的关系,通过端到端的方式训练模型,自动学习文本和图像的匹配关系,从而实现文本到图像的跨模态检索。本发明针对复杂的商品图像,应用多层次的特征以及多粒度的相似性来进行跨模态检索,具有优越的性能优势,并且利用深度学习技术,极大提高了检索的性能和效率。
-
公开(公告)号:CN117854160A
公开(公告)日:2024-04-09
申请号:CN202311758536.5
申请日:2023-12-20
Applicant: 浙江大学
IPC: G06V40/40 , G06V40/16 , G06V10/56 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供了一种基于人工多模态和细粒度补丁的人脸活体检测方法及系统,本发明通过从RGB图像中人工创造稠密光流模态、时间池化模态、摩尔纹模态和深度图模态,并将这些人工模态进行融合,旨在解决单RGB图像检测准确率下降的问题,同时避免了使用额外传感器采集多模态信息带来的高昂部署成本。本发明采用从面部图像中裁剪出的补丁来对局部特征进行识别,从而提高了检测的准确性。本发明采用了基于非对称边缘的分类损失和自监督相似性损失来规范特征嵌入空间,从而提高了检测的稳定性和可靠性。
-
公开(公告)号:CN114625924B
公开(公告)日:2022-08-26
申请号:CN202210529260.2
申请日:2022-05-16
Applicant: 浙江大学
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于多视觉专家知识蒸馏的侵权视频检索方法及系统,属于侵权视频检索技术领域。该方法包括:首先通过预训练的视觉模型获取视频的初始特征,然后通过在目标数据集上对视频的初始特征进行编码训练,得到具有更强任务适应性的视频特征表示。接着设计知识融合方法将多种基础检索模型的知识进行融合,融合后的知识通过知识蒸馏的方式迁移到蒸馏检索模型中。最终得到的融合了多位专家知识的蒸馏检索模型具有更高的计算效率和更加优越的性能。本发明利用深度学习技术和知识蒸馏技术,能够实现高效鲁棒的侵权视频检索,在很大程度上提高了侵权视频检索的性能和效率。
-
公开(公告)号:CN114625924A
公开(公告)日:2022-06-14
申请号:CN202210529260.2
申请日:2022-05-16
Applicant: 浙江大学
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于多视觉专家知识蒸馏的侵权视频检索方法及系统,属于侵权视频检索技术领域。该方法包括:首先通过预训练的视觉模型获取视频的初始特征,然后通过在目标数据集上对视频的初始特征进行编码训练,得到具有更强任务适应性的视频特征表示。接着设计知识融合方法将多种基础检索模型的知识进行融合,融合后的知识通过知识蒸馏的方式迁移到蒸馏检索模型中。最终得到的融合了多位专家知识的蒸馏检索模型具有更高的计算效率和更加优越的性能。本发明利用深度学习技术和知识蒸馏技术,能够实现高效鲁棒的侵权视频检索,在很大程度上提高了侵权视频检索的性能和效率。
-
公开(公告)号:CN112860930A
公开(公告)日:2021-05-28
申请号:CN202110185623.0
申请日:2021-02-10
Applicant: 浙江大学
IPC: G06F16/532 , G06F16/583 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于层次化相似性学习的文本到商品图像的检索方法,该方法通过预训练的目标检测模型和利用独热编码以及预训练的Word2Vec获取图像和文本的初步特征,再通过两个层次化编码网络分别对两种模态进行层次化编码。通过全连接层将特征映射到一个统一公共空间中,进行两种不同粒度的相似性度量,分别是物体粒度的相似性和图像粒度的相似性,最后利用公共空间算法学习两个模态之间的关系,通过端到端的方式训练模型,自动学习文本和图像的匹配关系,从而实现文本到图像的跨模态检索。本发明针对复杂的商品图像,应用多层次的特征以及多粒度的相似性来进行跨模态检索,具有优越的性能优势,并且利用深度学习技术,极大提高了检索的性能和效率。
-
-
-
-
-
-
-
-
-