-
公开(公告)号:CN116309653B
公开(公告)日:2023-08-29
申请号:CN202310560357.4
申请日:2023-05-18
Applicant: 中国科学技术大学
IPC: G06T7/12 , G06T5/50 , G06V10/26 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种弱监督图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,方案中:通过训练一个孪生网络,对图像的不确定像素进行网络间的交互监督,以实现网络对不确定像素的鲁棒学习,减缓伪标签噪声的影响;同时针对边界噪声的问题,通过构造一些边界已知的样本来增强边缘区域的预测能力;综上,本发明通过结合提出的边界增强和协同训练方式,有效减缓了伪标签噪声的影响,提高了网络的语义分割性能,能够更为准确的实现图像的语义分割。
-
公开(公告)号:CN114359711A
公开(公告)日:2022-04-15
申请号:CN202111508103.5
申请日:2021-12-10
Applicant: 国网安徽省电力有限公司超高压分公司 , 中国科学技术大学先进技术研究院 , 国家电网有限公司
Inventor: 董翔宇 , 朱涛 , 刘之奎 , 徐斓瑛 , 容圣海 , 李腾 , 廖军 , 罗沙 , 谢佳 , 李卫国 , 黄道均 , 王子磊 , 周正 , 张俊杰 , 王刘芳 , 李冀 , 刘鑫 , 朱元付 , 常文婧
IPC: G06V20/10 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06T3/40
Abstract: 本发明提供一种自适应步幅卷积的细粒度图像识别方法及系统,属于图像识别技术领域。所述识别方法包括:将待分类图像输入注意力图提取器中以得到具有突出判别区域的注意力图,其中,所述注意力图提取器包括卷积神经网络、特征图重塑模块和三线性乘积模块,所述卷积神经网络用于根据所述待分类图像生成对应的特征图,所述特征图重塑模块用于将所述特征图重塑成矩阵,所述三线性乘积模块用于根据所述矩阵生成所述注意力图;采用步幅向量生成器根据所述注意力图生成用于表示卷积核分别沿着x轴和y轴方向上扫描的步幅向量;采用动态步幅卷积模块根据所述步幅向量对所述特征图进行滑窗计算以得到所述识别结果。该识别方法及系统能够提高图像识别的准确性。
-
公开(公告)号:CN116309653A
公开(公告)日:2023-06-23
申请号:CN202310560357.4
申请日:2023-05-18
Applicant: 中国科学技术大学
IPC: G06T7/12 , G06T5/50 , G06V10/26 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种弱监督图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,方案中:通过训练一个孪生网络,对图像的不确定像素进行网络间的交互监督,以实现网络对不确定像素的鲁棒学习,减缓伪标签噪声的影响;同时针对边界噪声的问题,通过构造一些边界已知的样本来增强边缘区域的预测能力;综上,本发明通过结合提出的边界增强和协同训练方式,有效减缓了伪标签噪声的影响,提高了网络的语义分割性能,能够更为准确的实现图像的语义分割。
-
公开(公告)号:CN106168853A
公开(公告)日:2016-11-30
申请号:CN201610475628.6
申请日:2016-06-23
Applicant: 中国科学技术大学
IPC: G06F3/01
Abstract: 本发明公开了一种头戴式视频采集装置,同时采集4路近红外眼部视频和1路场景视频,所述4路近红外眼部视频包括来自佩戴该头戴式视频采集装置的穿戴者的左眼和右眼的各2路近红外眼部视频;立体视觉估算双眼光轴单元,通过立体视觉的方法直接估算双眼瞳孔和角膜球心坐标,计算双眼光轴直线方程;以及双眼视线及凝视点估算单元,根据眼球Kappa角和双眼光轴直线方程估算双眼视轴直线方程,进而计算出凝视点坐标,映射出凝视点在场景视频中的位置并进行标注,所述Kappa角是每个眼球的光轴和视轴之间的固定夹角。
-
公开(公告)号:CN114359711B
公开(公告)日:2025-01-10
申请号:CN202111508103.5
申请日:2021-12-10
Applicant: 国网安徽省电力有限公司超高压分公司 , 中国科学技术大学先进技术研究院 , 国家电网有限公司
Inventor: 董翔宇 , 朱涛 , 刘之奎 , 徐斓瑛 , 容圣海 , 李腾 , 廖军 , 罗沙 , 谢佳 , 李卫国 , 黄道均 , 王子磊 , 周正 , 张俊杰 , 王刘芳 , 李冀 , 刘鑫 , 朱元付 , 常文婧
IPC: G06V20/10 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084 , G06T3/4007
Abstract: 本发明提供一种自适应步幅卷积的细粒度图像识别方法及系统,属于图像识别技术领域。所述识别方法包括:将待分类图像输入注意力图提取器中以得到具有突出判别区域的注意力图,其中,所述注意力图提取器包括卷积神经网络、特征图重塑模块和三线性乘积模块,所述卷积神经网络用于根据所述待分类图像生成对应的特征图,所述特征图重塑模块用于将所述特征图重塑成矩阵,所述三线性乘积模块用于根据所述矩阵生成所述注意力图;采用步幅向量生成器根据所述注意力图生成用于表示卷积核分别沿着x轴和y轴方向上扫描的步幅向量;采用动态步幅卷积模块根据所述步幅向量对所述特征图进行滑窗计算以得到所述识别结果。该识别方法及系统能够提高图像识别的准确性。
-
公开(公告)号:CN106168853B
公开(公告)日:2019-10-01
申请号:CN201610475628.6
申请日:2016-06-23
Applicant: 中国科学技术大学
IPC: G06F3/01
Abstract: 本发明公开了一种头戴式视频采集装置,同时采集4路近红外眼部视频和1路场景视频,所述4路近红外眼部视频包括来自佩戴该头戴式视频采集装置的穿戴者的左眼和右眼的各2路近红外眼部视频;立体视觉估算双眼光轴单元,通过立体视觉的方法直接估算双眼瞳孔和角膜球心坐标,计算双眼光轴直线方程;以及双眼视线及凝视点估算单元,根据眼球Kappa角和双眼光轴直线方程估算双眼视轴直线方程,进而计算出凝视点坐标,映射出凝视点在场景视频中的位置并进行标注,所述Kappa角是每个眼球的光轴和视轴之间的固定夹角。
-
-
-
-
-