-
公开(公告)号:CN116363372A
公开(公告)日:2023-06-30
申请号:CN202310636751.1
申请日:2023-06-01
Applicant: 之江实验室
IPC: G06V10/26 , G06V10/764 , G06N3/0464 , G06N3/0895
Abstract: 本申请涉及一种弱监督语义分割方法、装置、设备和存储介质,通过根据图像的编码特征生成类别概率,通过类别概率与类别标签构建第一损失函数;通过编码特征以及图像像素的颜色距离与空间距离,获得图像的不确定性分布数据与伪标签,根据不确定性分布数据构建第二损失函数;根据图像中对应于不同伪标签的多个像素集合,构建第三损失函数。根据第一损失函数、第二损失函数以及第三损失函数,生成总损失,根据总损失调节分类网络模型与分割网络模型的模型参数,并根据分类结果得到语义分割结果,针对伪标签的不确定性问题进行了优化,从而解决了图像语义分割的准确率较低的问题,提高了图像语义分割的准确率。
-
公开(公告)号:CN115908955B
公开(公告)日:2023-06-20
申请号:CN202310202396.7
申请日:2023-03-06
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/778 , G06V40/10
Abstract: 本发明公开了基于梯度蒸馏的少样本学习的鸟类分类系统、方法与装置,通过构建鸟类图像分类数据集;在训练阶段,从鸟类图像分类数据集抽取支撑集s和预测集q,经教师网络后,分别输出的特征向量进行匹配,得到预测集q的类别预测结果,并利用所述预测结果与预测集q的类别真值构建教师网络交叉熵损失函数,训练教师网络;获取鸟类图像经过教师网络、学生网络各个网络层的特征,并利用各层特征的和,作为损失值反向传播,得到输入的鸟类图像基于损失值的梯度信息,构建梯度损失函数,使教师网络和学生网络输入的鸟类图像的梯度信息相匹配;梯度损失函数叠加学生网络交叉熵损失函数,训练学生网络,用于鸟类图像分类。
-
公开(公告)号:CN115311504A
公开(公告)日:2022-11-08
申请号:CN202211236327.X
申请日:2022-10-10
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于注意力重定位的弱监督定位方法和装置,将图像切分成图像块并线性投影映射成局部表征,利用网络中第一层至倒数第二层的transformer层的自注意力机制构建类别关联向量;对类别关联向量进行排序和积分图操作,构建重定位二值矩阵;构建掩码transformer层,局部表征输入掩码transformer层中获得分类权重向量;基于分类权重向量对局部表征实现加权和操作,将类别表征和加权和结果一并送入最后一层transformer层;训练过程中,对最后一层transformer层的输出类别表征和图像类别标签构建交叉熵损失函数,进行训练。测试过程中融合类别关联向量和分类权重向量,获得目标检测框信息,实现目标定位。相较于现有技术,本发明充分发挥transformer长程依赖能力,目标定位能力更优。
-
公开(公告)号:CN115063732A
公开(公告)日:2022-09-16
申请号:CN202210980578.2
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06V20/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于双流多分辨率综合建模的动作视频分类方法和系统,包括以下步骤:步骤S1:从视频样本中构建高分辨率稀疏采样帧和低分辨率稠密采样帧两种网络输入;步骤S2:所提出的双流多分辨率建模网络包含两个分支,分别处理这两种输入;步骤S3:利用侧边连接进行特征融合,得到融合后的空域卷积特征;步骤S4:两个分支得到的视频卷积特征分别经过2D池化操作和3D池化操作进行时空对齐,并在加权融合后输入全连接层,得到各视频段的预测结果;步骤S5:将各视频段的预测结果均匀融合得到原始视频的分类结果,进行网络训练。本发明基于时空多层次建模思想,分别构建两种网络输入,这两种输入包含互补的空域表观和时域运动信息,且降低运算开销。
-
公开(公告)号:CN113869463B
公开(公告)日:2022-04-15
申请号:CN202111457536.2
申请日:2021-12-02
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于交叉增强匹配的长尾噪声学习方法,用于解决同时具有长尾特征与噪声标签的图像分类问题。根据数据噪声特征,该方法通过对弱增强数据与强增强数据分别取得的预测结果进行匹配来筛选噪声样本,并引入一种剔除噪声的正则化措施来消除被识别噪声样本的影响。针对数据长尾特征,该方法实施一种新的基于在线先验分布的预测惩罚以避免对头部类别的偏置。本发明实现方法简便,手段灵活,在实时获取类拟合度方面具有优势,因此在长尾数据、噪声数据以及同时具有二者特征的训练数据上都取得显著的分类效果提升。
-
公开(公告)号:CN113837154B
公开(公告)日:2022-03-25
申请号:CN202111411082.5
申请日:2021-11-25
Applicant: 之江实验室
IPC: G06V20/52 , G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多任务辅助的开放集过滤系统及方法,用于解决监控场景下属性分类过程中的开放集干扰问题。该系统包括图像划分层、池化层和全连接层,图像划分层与池化层之间的每个网络阶段,包括固定窗口多头自注意力机制块和移动窗口多头自注意力机制块,将每个网络阶段的固定窗口多头自注意力机制块串联;该方法利用transformer能够实现全网络感受野不变的特点,在构建的属性分类网络上,加入分割分支实现图像块分割,利用图像块分割过滤属性分类中的开放集,针对图像块分割过程中背景、前景数量不均衡问题,实施一种新的基于特征增广的惩罚公式,提升图像块分割分支前景、背景的识别效果。
-
公开(公告)号:CN113869463A
公开(公告)日:2021-12-31
申请号:CN202111457536.2
申请日:2021-12-02
Applicant: 之江实验室
Abstract: 本发明公开了一种基于交叉增强匹配的长尾噪声学习方法,用于解决同时具有长尾特征与噪声标签的图像分类问题。根据数据噪声特征,该方法通过对弱增强数据与强增强数据分别取得的预测结果进行匹配来筛选噪声样本,并引入一种剔除噪声的正则化措施来消除被识别噪声样本的影响。针对数据长尾特征,该方法实施一种新的基于在线先验分布的预测惩罚以避免对头部类别的偏置。本发明实现方法简便,手段灵活,在实时获取类拟合度方面具有优势,因此在长尾数据、噪声数据以及同时具有二者特征的训练数据上都取得显著的分类效果提升。
-
公开(公告)号:CN113837154A
公开(公告)日:2021-12-24
申请号:CN202111411082.5
申请日:2021-11-25
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多任务辅助的开放集过滤系统及方法,用于解决监控场景下属性分类过程中的开放集干扰问题。该系统包括图像划分层、池化层和全连接层,图像划分层与池化层之间的每个网络阶段,包括固定窗口多头自注意力机制块和移动窗口多头自注意力机制块,将每个网络阶段的固定窗口多头自注意力机制块串联;该方法利用transformer能够实现全网络感受野不变的特点,在构建的属性分类网络上,加入分割分支实现图像块分割,利用图像块分割过滤属性分类中的开放集,针对图像块分割过程中背景、前景数量不均衡问题,实施一种新的基于特征增广的惩罚公式,提升图像块分割分支前景、背景的识别效果。
-
-
-
-
-
-
-