-
公开(公告)号:CN113688864A
公开(公告)日:2021-11-23
申请号:CN202110796727.5
申请日:2021-07-14
申请人: 淮阴工学院
摘要: 本发明涉及计算机视觉技术领域,公开了一种基于分裂注意力的人‑物交互关系分类方法,构建基础网络块、特征分裂模块以及实例级自注意力模块组成分裂注意力神经网络;将底层特征输入分裂注意力神经网络中,得到人和物的外观特征BP;通过对特征进行裁剪、卷积、池化后得到人的局部动作特征,将图像映射为双通道二值图并提取"人‑物"对的空间特征,将空间特征与人的局部动作特征按通道拼接后输入分裂注意力神经网络,得到"人‑物"对的空间特征CP;将BP与CP通过自注意力机制进行特征融合,得到分类结果。与现有技术相比,本发明能够在不增加计算开销的前提下,更加精确地对相似交互关系进行人‑物交互关系分类。
-
公开(公告)号:CN113688864B
公开(公告)日:2022-05-27
申请号:CN202110796727.5
申请日:2021-07-14
申请人: 淮阴工学院
IPC分类号: G06V10/764 , G06K9/62 , G06V10/40 , G06N3/04 , G06N3/08
摘要: 本发明涉及计算机视觉技术领域,公开了一种基于分裂注意力的人‑物交互关系分类方法,构建基础网络块、特征分裂模块以及实例级自注意力模块组成分裂注意力神经网络;将底层特征输入分裂注意力神经网络中,得到人和物的外观特征BP;通过对特征进行裁剪、卷积、池化后得到人的局部动作特征,将图像映射为双通道二值图并提取"人‑物"对的空间特征,将空间特征与人的局部动作特征按通道拼接后输入分裂注意力神经网络,得到"人‑物"对的空间特征CP;将BP与CP通过自注意力机制进行特征融合,得到分类结果。与现有技术相比,本发明能够在不增加计算开销的前提下,更加精确地对相似交互关系进行人‑物交互关系分类。
-
公开(公告)号:CN113689434B
公开(公告)日:2022-05-27
申请号:CN202110796736.4
申请日:2021-07-14
申请人: 淮阴工学院
摘要: 本发明公开了一种基于条带池化的图像语义分割方法,包括:提取图像分割训练数据集的图像特征;将图像特征输入深度空洞卷积模块,通过紧缩激励模块压缩得到紧密特征图和底层特征图;将紧密特征图进行金字塔编码得到五个特征图,并对其分别解码,并与底层特征图进行融合,拼接为融合特征图;将底层特征图条带池化编码,提取高级特征后,解码得到池化后的特征图;将池化后的特征图和融合特征图进行加法融合,再经降噪解码后得到图像分割输出;输入数据集进行训练保存为SD‑NET模型,将图片输入到SD‑NET模型得到分割结果。本发明利用条带池化提取底层特征,结合紧缩激励层和非局部层进一步去除图像噪声,在图像上采样时进一步融合。
-
公开(公告)号:CN113689434A
公开(公告)日:2021-11-23
申请号:CN202110796736.4
申请日:2021-07-14
申请人: 淮阴工学院
摘要: 本发明公开了一种基于条带池化的图像语义分割方法,包括:提取图像分割训练数据集的图像特征;将图像特征输入深度空洞卷积模块,通过紧缩激励模块压缩得到紧密特征图和底层特征图;将紧密特征图进行金字塔编码得到五个特征图,并对其分别解码,并与底层特征图进行融合,拼接为融合特征图;将底层特征图条带池化编码,提取高级特征后,解码得到池化后的特征图;将池化后的特征图和融合特征图进行加法融合,再经降噪解码后得到图像分割输出;输入数据集进行训练保存为SD‑NET模型,将图片输入到SD‑NET模型得到分割结果。本发明利用条带池化提取底层特征,结合紧缩激励层和非局部层进一步去除图像噪声,在图像上采样时进一步融合。
-
-
-