-
公开(公告)号:CN116485689B
公开(公告)日:2023-11-14
申请号:CN202310749638.4
申请日:2023-06-25
申请人: 武汉大水云科技有限公司 , 武汉大学
IPC分类号: G06T5/00 , G06V10/774 , G06V10/82 , G06V10/40 , G06V10/80 , G06V20/70 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本发明提供了一种基于CNN和Transformer的渐进式耦合图像去雨方法和系统。本发明不同于单一的卷积神经网络和Transformer模型,而是整合了这两种结构的优点,同时保持了去除雨水扰动的有效性和效率。此外,本发明实现了无雨背景和雨水残差特征的逐步分解和关联。为了减轻计算负担,本发明中将其设计成非对称的双路径相互表示网络,同时在本发明中,为了降低计算的复杂度,网络多处使用高效的卷积结构和分辨率重整的策略。经过大量的实验表明,本发明的方法可以有效地去除图像中的雨纹干扰,且更加轻量,具有相对于主流方法更高的效率。
-
公开(公告)号:CN116485689A
公开(公告)日:2023-07-25
申请号:CN202310749638.4
申请日:2023-06-25
申请人: 武汉大水云科技有限公司 , 武汉大学
IPC分类号: G06T5/00 , G06V10/774 , G06V10/82 , G06V10/40 , G06V10/80 , G06V20/70 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本发明提供了一种基于CNN和Transformer的渐进式耦合图像去雨方法和系统。本发明不同于单一的卷积神经网络和Transformer模型,而是整合了这两种结构的优点,同时保持了去除雨水扰动的有效性和效率。此外,本发明实现了无雨背景和雨水残差特征的逐步分解和关联。为了减轻计算负担,本发明中将其设计成非对称的双路径相互表示网络,同时在本发明中,为了降低计算的复杂度,网络多处使用高效的卷积结构和分辨率重整的策略。经过大量的实验表明,本发明的方法可以有效地去除图像中的雨纹干扰,且更加轻量,具有相对于主流方法更高的效率。
-
公开(公告)号:CN116468744B
公开(公告)日:2023-09-05
申请号:CN202310723846.7
申请日:2023-06-19
申请人: 武汉大水云科技有限公司
IPC分类号: G06T7/11 , G06N3/096 , G06N3/0985 , G06N3/094 , G06N3/084
摘要: 本发明提出了一种面向水域场景的双分布匹配多域适应分割方法与系统,该方法包括:获取单峰分布的源域数据集,使用傅里叶变换对源域数据集进行风格变换,得到不同目标域风格的源域图像;对不同目标域风格的源域图像进行粗粒度的多判别器对抗训练,进行整体分布匹配;使用傅里叶变换获取不同目标域风格的源域数据,统计不同风格源域的语义分布;基于语义分布感知的对比学习方法,进行细粒度的类分布匹配,匹配相同风格的源域与目标域的分布;使用基于伪标签的自训练策略,进一步提升网络在目标域上的分割性能。本发明为面向近岸水域的巡检和监控研究提供了有益的探索,对于解决多目标域适应语义分割问题具有重要的理论意义和实际应用价值。
-
公开(公告)号:CN116844241B
公开(公告)日:2024-01-16
申请号:CN202311101311.2
申请日:2023-08-30
申请人: 武汉大水云科技有限公司
摘要: 本发明公开了基于着色的红外视频行为识别方法、系统和电子设备。针对背景噪点对红外视频的消极影响,提出颜色通道选择网络,将图像从RGB映射至CIE Lab,选择通道并加权融合,提高前背景的对比度;针对红外图像色彩细节信息丢失的问题,提出颜色通道增强网络,将背景与人物实例分离后,根据亮度通道预测色度信息,分别对完整图像和实例进行增强,将背景着色图与实例着色图按权重融合,使其更贴合红外视频的行为识别方法;针对模型融合不对齐问题,将上述两个网络的图像特征与光流特征分别转换为对应证据加以计算,得到样本数据特征的狄利克雷分布,进而确定每个模型的不确定度,(56)对比文件Leping Lin等《.A Target IdentificationMethod Based on Uncertainty Estimationand Evidence Theory》《.2022 4thInternational Conference on FrontiersTechnology of Information and Computer》.2023,第Ⅱ节.Jheng-Wei Su等《.Instance-aware ImageColorization》《.CVPR2020》.2020,全文.
-
公开(公告)号:CN116844241A
公开(公告)日:2023-10-03
申请号:CN202311101311.2
申请日:2023-08-30
申请人: 武汉大水云科技有限公司
摘要: 本发明公开了基于着色的红外视频行为识别方法、系统和电子设备。针对背景噪点对红外视频的消极影响,提出颜色通道选择网络,将图像从RGB映射至CIE Lab,选择通道并加权融合,提高前背景的对比度;针对红外图像色彩细节信息丢失的问题,提出颜色通道增强网络,将背景与人物实例分离后,根据亮度通道预测色度信息,分别对完整图像和实例进行增强,将背景着色图与实例着色图按权重融合,使其更贴合红外视频的行为识别方法;针对模型融合不对齐问题,将上述两个网络的图像特征与光流特征分别转换为对应证据加以计算,得到样本数据特征的狄利克雷分布,进而确定每个模型的不确定度,动态分配各模型融合的权重,从而根据最终分类器得到最优的分类结果。
-
公开(公告)号:CN116468744A
公开(公告)日:2023-07-21
申请号:CN202310723846.7
申请日:2023-06-19
申请人: 武汉大水云科技有限公司
IPC分类号: G06T7/11 , G06N3/096 , G06N3/0985 , G06N3/094 , G06N3/084
摘要: 本发明提出了一种面向水域场景的双分布匹配多域适应分割方法与系统,该方法包括:获取单峰分布的源域数据集,使用傅里叶变换对源域数据集进行风格变换,得到不同目标域风格的源域图像;对不同目标域风格的源域图像进行粗粒度的多判别器对抗训练,进行整体分布匹配;使用傅里叶变换获取不同目标域风格的源域数据,统计不同风格源域的语义分布;基于语义分布感知的对比学习方法,进行细粒度的类分布匹配,匹配相同风格的源域与目标域的分布;使用基于伪标签的自训练策略,进一步提升网络在目标域上的分割性能。本发明为面向近岸水域的巡检和监控研究提供了有益的探索,对于解决多目标域适应语义分割问题具有重要的理论意义和实际应用价值。
-
公开(公告)号:CN107273873B
公开(公告)日:2019-09-17
申请号:CN201710572155.6
申请日:2017-07-13
摘要: 本发明提供基于不规则视频序列的行人重识别方法及系统,包括通过检测状态曲线中的稳定点,从视频序列提取多个连续的子序列,得到候选序列;利用稀疏表示求取每个子序列的重构误差,得到各子序列的噪声度量结果;根据各子序列的噪声度量结果,从候选序列中剔除噪声大于相应阈值的子序列,构成候选池;进行自适应权重的行人特征表示,得到基于视频序列的检索结果。本发明提升了不规则序列下行人重识别的性能,可广泛用于监控领域、视频分析以及其他多媒体应用,精度高,效果好,具有重要的市场价值。
-
公开(公告)号:CN107273873A
公开(公告)日:2017-10-20
申请号:CN201710572155.6
申请日:2017-07-13
摘要: 本发明提供基于不规则视频序列的行人重识别方法及系统,包括通过检测状态曲线中的稳定点,从视频序列提取多个连续的子序列,得到候选序列;利用稀疏表示求取每个子序列的重构误差,得到各子序列的噪声度量结果;根据各子序列的噪声度量结果,从候选序列中剔除噪声大于相应阈值的子序列,构成候选池;进行自适应权重的行人特征表示,得到基于视频序列的检索结果。本发明提升了不规则序列下行人重识别的性能,可广泛用于监控领域、视频分析以及其他多媒体应用,精度高,效果好,具有重要的市场价值。
-
公开(公告)号:CN117809337A
公开(公告)日:2024-04-02
申请号:CN202311855504.7
申请日:2023-12-29
申请人: 武汉大学
IPC分类号: G06V40/10 , G06V10/774 , G06V10/82 , G06V20/52
摘要: 一种低光照场景下针对行人检测器的隐藏攻击方法、装置、设备及计算机可读存储介质,包括:通过基于采集到的光效应图像对预置网络进行训练,生成光效应生成器;根据所述光效应生成器、获取到的预设低光照行人检测数据集和预设光效应属性掩码,获取所述预设低光照行人检测数据集中各个低光照行人图像的对抗样本;基于预设检测器,根据所述对抗样本,获取对应的人体位置信息;根据所述人体位置信息,获取最优的光效应掩码;预设光源生成器按照所述最优的光效应掩码进行隐藏攻击,解决了相关技术中存在的在弱光或低光照条件下,攻击性能往往会急剧下降,甚至丧失攻击性的技术问题,使攻击者有效地在低光照条件下逃避现实世界中智能监控摄像头的检测。
-
公开(公告)号:CN113204999A
公开(公告)日:2021-08-03
申请号:CN202110371682.7
申请日:2021-04-07
申请人: 武汉大学
摘要: 本发明公开了一种基于信息复用注意力机制的表情识别方法。本发明提出一种新的注意力模块,该注意力模块通过信息复用减少了生成注意图过程中信息的损耗,使得生成的注意图蕴含更多的有用信息,以帮助提取到更加有效的表情特征。对于提出的信息复用注意力模块,首先,将当前卷积层输出的特征图和前一层卷积层输出的特征图在通道方向上进行连接;然后将连接后的特征图输入到另一个卷积层中,输出和当前卷积层特征图尺寸一样的注意图;最后将注意图和当前卷积层的特征图进行逐元素乘并输入到Sigmoid函数中,输出的结果就是经过注意图修饰的特征图。本发明通过实验证明了该方法的有效性,相较其他先进的复杂条件表情识别方法有较大提升。
-
-
-
-
-
-
-
-
-