-
公开(公告)号:CN117789212A
公开(公告)日:2024-03-29
申请号:CN202410040216.4
申请日:2024-01-11
申请人: 河南科技大学
IPC分类号: G06V20/70 , G06V10/26 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
摘要: 一种基于双分支级联注意力网络的实时语义分割方法,经处理得到初级特征图;初级特征图经过连续的基本残差卷积块和双分辨率模块,得到低分辨率特征图和高分辨率特征图;将步骤2得到的低分辨率特征图和高分辨率特征图输入至双分支级联注意力网络,得到特征图FA和FW2;将特征图FA作为低分辨率特征图、特征图FW2作为高分辨率特征图输入双分支级联注意力网络,得到高分辨分支输出特征图FH,低分辨率分支输出特征图FL;将特征图FL通过深度聚合金字塔池化模块、融合上采样,最终输出分割效果图。本方法能够优化注意力机制并减少计算量,实现高分辨分支和低分辨率分支之间的交互,实现卷积网络和注意力机制的互补,提高实时语义分割的性能。
-
公开(公告)号:CN117409291A
公开(公告)日:2024-01-16
申请号:CN202311335628.2
申请日:2023-10-16
申请人: 河南科技大学
摘要: 本发明公开了一种基于细化特征增强网络的目标检测方法,首先通过骨干网处理输入图片进行初步特征提取,获取三个有效特征图C3、C4、C5,其次特征增强模块对提取的有效特征图C5进行增强得到特征图C5’,然后使用多分支扩张注意力机制进行细化,得到特征图C5’’,再通过特征金字塔融合特征图C3、C4、C5’’得到融合特征结果图输出图片中的物体位置、类别和置信度,最后进行模型训练,输出检测结果。本发明提出了特征增强模块和多分支扩张注意力机制,用于特征图的增强和细化,从而获得有效的全局信息。
-
公开(公告)号:CN117853338A
公开(公告)日:2024-04-09
申请号:CN202410040211.1
申请日:2024-01-11
申请人: 河南科技大学
IPC分类号: G06T3/4053 , G06T3/4046 , G06N3/0455 , G06N3/0464 , G06N3/082
摘要: 一种基于交叉丢失动态学习网络的图像盲超分方法,通过搭建交叉丢失动态学习网络,交叉丢失动态学习网络包括退化预测块、动态超分主干网DynNet、陀螺结构、交叉丢弃和动态卷积Dynamic,通过总损失函数训练交叉丢失动态学习网络,迭代多次,得到训练完成的交叉丢失动态学习网络,将待处理图输入训练完成后的交叉丢失动态学习网络中,得到最终处理后的高分辨率图像。本发明具有确定的交叉丢失动态学习网络模型,通过陀螺结构和动态卷积组合提升适应性,交叉丢弃可以增强网络的图像超分辨率效果。
-
公开(公告)号:CN118736220A
公开(公告)日:2024-10-01
申请号:CN202410833397.6
申请日:2024-06-25
申请人: 河南科技大学
IPC分类号: G06V10/26 , G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06V10/77 , G06N3/045 , G06N3/0464 , G06N3/084
摘要: 本发明提供一种基于注意力嵌套双分支网络的实时语义分割方法,本方案的ANDNet双分支网络包含语义分支和简化的细节分支,简化的细节分支减少了空间细节分支的冗余部分,这样设计在维持高分辨率输入特征的同时也保证了一定的速度。引入SCM模块建立语义分支和细节分支特征映射之间的位置关系,进行特征对齐,尽可能的保留特征内容;同时设计上下文嵌套注意力融合模块CNAFM利用注意力机制,以嵌套的形式快速有效的融合两个分支的信息,从而获得更加有竞争性的结果。本方案能有效提取和融合图像的特征信息,实现不错的分割效果。
-
公开(公告)号:CN118710902A
公开(公告)日:2024-09-27
申请号:CN202410832338.7
申请日:2024-06-25
申请人: 河南科技大学
IPC分类号: G06V10/26 , G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种基于连续注意力三分支网络的实时语义分割方法,通过连续注意力交互模块提升不同分辨率特征图之间的语义表达,增加双分支之间信息交互,减少独立双分支之间的语义间隙,提升模型的性能。三分支细节注意融合模块使用自注意力机制对语义分支和细节分支进行融合,利用额外的细节分支进行再次融合,从而获得更好的细节表现。实现了速度和性能之间的平衡,可以很好的保证较高的精度和较快的推理速度。分割结果更清晰、标签分类更加正确,实现不错的分割效果。
-
公开(公告)号:CN117409292A
公开(公告)日:2024-01-16
申请号:CN202311335632.9
申请日:2023-10-16
申请人: 河南科技大学
IPC分类号: G06V10/82 , G06V10/40 , G06V10/80 , G06V10/762 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于多尺度残差多分支的目标检测方法,首先聚类目标宽高比,划分单元格,然后对每幅图像进行骨干网络MSRes的特征提取,再使用特征金字塔结构对骨干网络不同特征层输出进行融合,最后在整个网络的不同深度进行多尺度特征融合并进行模型训练进行评估指标,输出检测结果。本发明由一个MSE结构、一个CFR结构和MSRes主干组成多尺度残差多分支网络的目标检测算法MRMNet,更关注多尺度表达能力和小目标检测精度,可以增强特征、缓解小对象被相互冲突的语义信息淹没的问题。
-
公开(公告)号:CN117409114A
公开(公告)日:2024-01-16
申请号:CN202311365738.3
申请日:2023-10-20
申请人: 河南科技大学
IPC分类号: G06T13/00 , G06T5/73 , G06T3/04 , G06N3/045 , G06N3/0475 , G06N3/094 , G06V10/74 , G06N3/0455 , G06N3/088 , G06V10/44
摘要: 本发明公开了一种基于两阶段可解释学习模型的图像卡通化方法,首先构建两阶段可解释学习模型;然后内容学习阶段训练编码器和解码器,使其学习到特征提取能力;风格化阶段,对风格转换模块进行训练,让其学习到风格转化的能力并添加分支CIE来使网络学习清晰的边缘,最后将上述两个阶段分别通过迭代训练,得到相应的训练权重后,输入想要转换风格的图片和加载相应风格的权重,得到卡通化输出结果。本发明通过明显区分的两阶段生成模型获得更好的可解释性和理解性,且风格化图像生成的内容和风格图像具有调整性,图像卡通化效果显著。
-
公开(公告)号:CN118071889A
公开(公告)日:2024-05-24
申请号:CN202311365740.0
申请日:2023-10-20
申请人: 河南科技大学
IPC分类号: G06T13/00 , G06T3/04 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/045 , G06V10/80
摘要: 本发明公开了一种基于特征解纠缠对抗学习模型的图像卡通化方法,首先构建特征解纠缠对抗学习(FDAL)模型,然后对FDAL模型预训练,通过改进的损失函数使生成器网络学会内容图像的分布,判别器网络不参与训练、不输入任何风格信息;再使用全部的损失函数对生成器网络和判别器网络进行交替双阶段的训练,对内容信息和风格信息进行学习,直到模型收敛为止,对训练完成的模型测试,输出卡通化结果。本发明设计双重编码器和无偏的转换模块用于解纠提取的内容风格特征并进一步融合提取的内容风格特征编码嵌入,并构建双结构风格学习判别器,通过改进的损失函数用于对抗性的学习这两种卡通风格表示,其处理高分辨率图像卡通化效果显著。
-
-
-
-
-
-
-