-
公开(公告)号:CN114897694B
公开(公告)日:2024-09-24
申请号:CN202210503215.X
申请日:2022-05-10
申请人: 南京航空航天大学
IPC分类号: G06T3/4053
摘要: 本发明公开了基于混合注意力和双层监督的图像超分辨率重建方法,包括获取高分辨率的标签图像和参考图像并对其进行下采样,构建得到数据集;对数据集的图像进行多尺度特征提取;利用transformer注意力从参考图像特征中获得对应特征;利用通道注意力对提取的对应特征自适应优化处理得到迁移特征;将迁移特征与低分辨率图像特征通过解码器网络融合实现高质量的图像重建,并采用双层监督信号更新网络参数最小化损失。本发明能够提高超分辨率重建的重建效果和视觉感受。
-
公开(公告)号:CN112905762B
公开(公告)日:2024-07-26
申请号:CN202110163405.7
申请日:2021-02-05
申请人: 南京航空航天大学
IPC分类号: G06F16/332 , G06V10/44 , G06V10/764 , G06N3/045 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于同等注意力图网络的视觉问答方法,包括以下步骤,首先,提取输入图像的区域目标特征,将图像转换成图表示,并对输入的问题进行编码;然后,建立一个基于图网络的视觉问答模型,将处理过程划分为两个阶段:第一阶段对图表示应用同等注意力机制,得到新的节点特征与关系边特征,第二阶段将第一阶段得到的节点特征与关系边特征融合成图特征,并与问题交互得到新的图特征,最终将得到的图特征与问题共同推断出答案。本发明实施于图像视觉问答,相比于利用整体图像特征的传统方法或是忽略关系重要性的其他图网络视觉问答方法,采用本发明的技术方案将有效提升视觉问答模型的性能。
-
公开(公告)号:CN114647465B
公开(公告)日:2022-08-16
申请号:CN202210559572.8
申请日:2022-05-23
申请人: 南京航空航天大学 , 国家电网有限公司信息通信分公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
摘要: 本发明公开了一种多通道注意力图神经网络聚类的单体程序拆分方法及系统,包括单体程序多属性图构建、多通道图神经网络特征嵌入表示学习、基于注意力的多通道特征嵌入融合、基于谱聚类的微服务拆分。通过图神经网络重构信息和聚类信息构建新的损失函数,实现了图注意力神经网络与聚类的联合学习框架,实现了提取微服务在功能性和模块性方面性能的提升。本发明结合单体程序多种属性信息,构建多通道图注意力网络,实现了更为高质量的特征嵌入表示,同时也提升了微服务提取方法的可扩展性,避免了微服务提取方法在应用中使用受限等问题。
-
公开(公告)号:CN112560668A
公开(公告)日:2021-03-26
申请号:CN202011470438.8
申请日:2020-12-14
申请人: 南京航空航天大学
摘要: 本发明公开了一种基于场景先验知识的人体行为识别方法,包括以下步骤:对输入视频进行预处理;建立室内场景‑人体行为先验知识库;建立视频场景识别模型和人体行为识别模型M;对输入视频进行场景预测,基于场景识别的结果,将对应的场景先验知识融合到人体行为识别网络模型M中,得到人体行为分类。本发明能够充分利用场景与人体活动的相关性,通过将先验知识转换成行为识别模型中对权值的约束,优化目标函数,有效提高视频中人体行为识别的效果。
-
公开(公告)号:CN112560668B
公开(公告)日:2024-10-15
申请号:CN202011470438.8
申请日:2020-12-14
申请人: 南京航空航天大学
IPC分类号: G06V20/40 , G06V40/20 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/084
摘要: 本发明公开了一种基于场景先验知识的人体行为识别方法,包括以下步骤:对输入视频进行预处理;建立室内场景‑人体行为先验知识库;建立视频场景识别模型和人体行为识别模型M;对输入视频进行场景预测,基于场景识别的结果,将对应的场景先验知识融合到人体行为识别网络模型M中,得到人体行为分类。本发明能够充分利用场景与人体活动的相关性,通过将先验知识转换成行为识别模型中对权值的约束,优化目标函数,有效提高视频中人体行为识别的效果。
-
公开(公告)号:CN114897694A
公开(公告)日:2022-08-12
申请号:CN202210503215.X
申请日:2022-05-10
申请人: 南京航空航天大学
IPC分类号: G06T3/40
摘要: 本发明公开了基于混合注意力和双层监督的图像超分辨率重建方法,包括获取高分辨率的标签图像和参考图像并对其进行下采样,构建得到数据集;对数据集的图像进行多尺度特征提取;利用transformer注意力从参考图像特征中获得对应特征;利用通道注意力对提取的对应特征自适应优化处理得到迁移特征;将迁移特征与低分辨率图像特征通过解码器网络融合实现高质量的图像重建,并采用双层监督信号更新网络参数最小化损失。本发明能够提高超分辨率重建的重建效果和视觉感受。
-
公开(公告)号:CN114647465A
公开(公告)日:2022-06-21
申请号:CN202210559572.8
申请日:2022-05-23
申请人: 南京航空航天大学 , 国家电网有限公司信息通信分公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
摘要: 本发明公开了一种多通道注意力图神经网络聚类的单体程序拆分方法及系统,包括单体程序多属性图构建、多通道图神经网络特征嵌入表示学习、基于注意力的多通道特征嵌入融合、基于谱聚类的微服务拆分。通过图神经网络重构信息和聚类信息构建新的损失函数,实现了图注意力神经网络与聚类的联合学习框架,实现了提取微服务在功能性和模块性方面性能的提升。本发明结合单体程序多种属性信息,构建多通道图注意力网络,实现了更为高质量的特征嵌入表示,同时也提升了微服务提取方法的可扩展性,避免了微服务提取方法在应用中使用受限等问题。
-
公开(公告)号:CN112905762A
公开(公告)日:2021-06-04
申请号:CN202110163405.7
申请日:2021-02-05
申请人: 南京航空航天大学
IPC分类号: G06F16/332 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于同等注意力图网络的视觉问答方法,包括以下步骤,首先,提取输入图像的区域目标特征,将图像转换成图表示,并对输入的问题进行编码;然后,建立一个基于图网络的视觉问答模型,将处理过程划分为两个阶段:第一阶段对图表示应用同等注意力机制,得到新的节点特征与关系边特征,第二阶段将第一阶段得到的节点特征与关系边特征融合成图特征,并与问题交互得到新的图特征,最终将得到的图特征与问题共同推断出答案。本发明实施于图像视觉问答,相比于利用整体图像特征的传统方法或是忽略关系重要性的其他图网络视觉问答方法,采用本发明的技术方案将有效提升视觉问答模型的性能。
-
-
-
-
-
-
-