基于区域建议注意力的目标检测方法

    公开(公告)号:CN110619356B

    公开(公告)日:2023-03-28

    申请号:CN201910802929.9

    申请日:2019-08-28

    Abstract: 本发明提供一种基于区域建议注意力的目标检测方法,针对RefineDet特征判别力不足的问题,将ARM生成的有无目标的分类结果特征谱作为区域建议注意力与ODM的多分类特征谱通过点乘的方式进行融合,在优化后的多分类特征谱中突出目标区域的显著性。本发明优化了多分类特征谱的判别力,提升了后续进行的RefineDet目标检测的分类效果,从而有效减少误检、漏检情况,提升目标检测的准确率。相比于现有RefineDet算法,能够在不增加参数的基础上,有效地提升目标检测的分类精度。

    一种结合全局运动参数的行为识别方法

    公开(公告)号:CN110610145B

    公开(公告)日:2022-11-08

    申请号:CN201910802207.3

    申请日:2019-08-28

    Abstract: 本发明提供一种结合全局运动参数的行为识别方法。由于智能设备是戴在头部的,所以随着头部的运动会产生全局运动信息,这对于行为识别会产生很大的干扰,将原始行为视频的特征与全局运动信息特征进行融合,能减少全局运动信息的影响。本发明不增加智能设备的成本,只稍微增加网络运行时间,计算复杂度低,将全局运动信息融入行为识别网络,为行为识别网络提供全局信息,减少头部抖动以及一些全局信息的干扰,使得预测准确率更高,而且全局运动参数的提取相对于光流的提取极大的降低了时间成本。

    一种结合多感受野注意与特征再校准的菜品识别方法

    公开(公告)号:CN110674845A

    公开(公告)日:2020-01-10

    申请号:CN201910802205.4

    申请日:2019-08-28

    Abstract: 本发明提供一种结合多感受野注意与特征再校准的菜品识别方法,包括:提取出特征金字塔的特征谱;对特征谱进行两种不同尺度的卷积,得到两个不同感受野的特征谱;对两个不同感受野的特征谱进行相加再卷积得到融合感受野的特征谱;对融合感受野的特征谱进行softmax操作获得融合感受野的权重谱;将获得的融合感受野的权重谱与两个不同感受野特征谱相乘,得到两个不同的注意力谱;对融合感受野的特征谱通过可变形卷积进行特征校准,得到融合感受野的特征校准谱;特征金字塔的特征谱、不同注意力谱、特征校准谱都对相应的元素相加起来就得到的特征谱来进行菜品识别。处理后的特征谱能增加菜品的细节信息并让有效特征都分布在菜品位置上,能提升识别准确率。

    基于特征空间超分辨映射的低分辨率人脸识别方法

    公开(公告)号:CN110647820A

    公开(公告)日:2020-01-03

    申请号:CN201910802224.7

    申请日:2019-08-28

    Abstract: 本发明所要解决的技术问题是提出一种基于特征空间超分辨映射的低分辨率人脸识别方法,设计了一个残差block作为映射模块基础架构,级联在人脸识别神经网络中特征提取部分之后。因为映射模块是一个轻量级神经网络,并且输入特征谱分辨率尺寸远低于原图尺寸,因此本方法的计算量远远低于图像空间超分辨率的方法,同时因为是在识别特征上映射,可以更有针对性地得到高判别性地高分辨人脸特征。本发明对低分辨率人脸识别有显著提升且计算代价很小,可以有效解决安防场景中无法识别低分辨率人脸的问题,是更适合实际产品部署的方法。

    一种结合全局运动参数的行为识别方法

    公开(公告)号:CN110610145A

    公开(公告)日:2019-12-24

    申请号:CN201910802207.3

    申请日:2019-08-28

    Abstract: 本发明提供一种结合全局运动参数的行为识别方法。由于智能设备是戴在头部的,所以随着头部的运动会产生全局运动信息,这对于行为识别会产生很大的干扰,将原始行为视频的特征与全局运动信息特征进行融合,能减少全局运动信息的影响。本发明不增加智能设备的成本,只稍微增加网络运行时间,计算复杂度低,将全局运动信息融入行为识别网络,为行为识别网络提供全局信息,减少头部抖动以及一些全局信息的干扰,使得预测准确率更高,而且全局运动参数的提取相对于光流的提取极大的降低了时间成本。

    基于特征空间超分辨映射的低分辨率人脸识别方法

    公开(公告)号:CN110647820B

    公开(公告)日:2023-04-07

    申请号:CN201910802224.7

    申请日:2019-08-28

    Abstract: 本发明所要解决的技术问题是提出一种基于特征空间超分辨映射的低分辨率人脸识别方法,设计了一个残差block作为映射模块基础架构,级联在人脸识别神经网络中特征提取部分之后。因为映射模块是一个轻量级神经网络,并且输入特征谱分辨率尺寸远低于原图尺寸,因此本方法的计算量远远低于图像空间超分辨率的方法,同时因为是在识别特征上映射,可以更有针对性地得到高判别性地高分辨人脸特征。本发明对低分辨率人脸识别有显著提升且计算代价很小,可以有效解决安防场景中无法识别低分辨率人脸的问题,是更适合实际产品部署的方法。

    一种结合多感受野注意与特征再校准的菜品识别方法

    公开(公告)号:CN110674845B

    公开(公告)日:2022-05-31

    申请号:CN201910802205.4

    申请日:2019-08-28

    Abstract: 本发明提供一种结合多感受野注意与特征再校准的菜品识别方法,包括:提取出特征金字塔的特征谱;对特征谱进行两种不同尺度的卷积,得到两个不同感受野的特征谱;对两个不同感受野的特征谱进行相加再卷积得到融合感受野的特征谱;对融合感受野的特征谱进行softmax操作获得融合感受野的权重谱;将获得的融合感受野的权重谱与两个不同感受野特征谱相乘,得到两个不同的注意力谱;对融合感受野的特征谱通过可变形卷积进行特征校准,得到融合感受野的特征校准谱;特征金字塔的特征谱、不同注意力谱、特征校准谱都对相应的元素相加起来就得到的特征谱来进行菜品识别。处理后的特征谱能增加菜品的细节信息并让有效特征都分布在菜品位置上,能提升识别准确率。

    一种改进的平行四边形候选框的文本检测方法

    公开(公告)号:CN110674802B

    公开(公告)日:2022-10-14

    申请号:CN201910857582.8

    申请日:2019-09-09

    Abstract: 本发明提出一种改进的平行四边形候选框的文本检测方法,在训练步骤以及检测步骤中,预测特征谱在进入PriorBox层之前先经过偏移学习模块,所述偏移学习模块用于输出预测特征谱以及候选框在Y轴方向的偏移量至PriorBox层;PriorBox层输出的候选框坐标包括矩形候选框坐标与引入偏移的平行四边形候选框;使用平行四边形的候选框来贴近标签GroundTruth,以提升GroundTruth与预测框之间的IoU,从而降低网络回归的困难程度。本发明能准确定位倾斜的长文本,适用于书籍文字识别、然场景下多方向文字识别。

    一种改进的平行四边形候选框的文本检测方法

    公开(公告)号:CN110674802A

    公开(公告)日:2020-01-10

    申请号:CN201910857582.8

    申请日:2019-09-09

    Abstract: 本发明提出一种改进的平行四边形候选框的文本检测方法,在训练步骤以及检测步骤中,预测特征谱在进入PriorBox层之前先经过偏移学习模块,所述偏移学习模块用于输出预测特征谱以及候选框在Y轴方向的偏移量至PriorBox层;PriorBox层输出的候选框坐标包括矩形候选框坐标与引入偏移的平行四边形候选框;使用平行四边形的候选框来贴近标签GroundTruth,以提升GroundTruth与预测框之间的IoU,从而降低网络回归的困难程度。本发明能准确定位倾斜的长文本,适用于书籍文字识别、然场景下多方向文字识别。

    基于区域建议注意力的目标检测方法

    公开(公告)号:CN110619356A

    公开(公告)日:2019-12-27

    申请号:CN201910802929.9

    申请日:2019-08-28

    Abstract: 本发明提供一种基于区域建议注意力的目标检测方法,针对RefineDet特征判别力不足的问题,将ARM生成的有无目标的分类结果特征谱作为区域建议注意力与ODM的多分类特征谱通过点乘的方式进行融合,在优化后的多分类特征谱中突出目标区域的显著性。本发明优化了多分类特征谱的判别力,提升了后续进行的RefineDet目标检测的分类效果,从而有效减少误检、漏检情况,提升目标检测的准确率。相比于现有RefineDet算法,能够在不增加参数的基础上,有效地提升目标检测的分类精度。

Patent Agency Ranking