基于无人驾驶技术对实例分割的改进方法

    公开(公告)号:CN110276378A

    公开(公告)日:2019-09-24

    申请号:CN201910417419.X

    申请日:2019-05-20

    Abstract: 本发明公开了一种基于无人驾驶技术来对实例分割进行改进的方法。本发明提出在基于MASK R-CNN的Faster R-CNN基础上对目标进行检测以及分类,之后通过FCN特征粗提取以及CRF优化输出从而实现实例分割。具体实现步骤如下:步骤1、使用偏监督的方法对目标进行分类;步骤2、在语义分割卷积过程中采用深度可分离卷积,获取特征;步骤3、对卷积层得到的特征进行特征融合优化,在低层引入语义信息,在高层引入空间信息。本发明使用较低的成本便建立了较好的目标检测及分类结果。本发明采用深度可分离卷积,提高分割结果的精度以及计算机的效率,减少时间的损耗。

    一种基于深度摄像头的商品检测方法

    公开(公告)号:CN110276260A

    公开(公告)日:2019-09-24

    申请号:CN201910429812.0

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于深度摄像头的商品检测方法,本发明包括以下步骤:1)利用深度摄像头获取摆放在结算台上的商品的深度信息及商品的深度图像。2)将深度信息转为灰度图像,从而使得灰度信息可视化;3)对去除背景噪声后的灰度图像进行图像增强;4)图像分割,设置合适的阈值将灰度图像转为二值图像,背景为黑色,感兴趣的商品区域为白色。5)边缘检测,对感兴趣的商品区域进行轮廓检测,找到商品的边缘轮廓,根据轮廓生成所需的包围盒信息。本发明无需提前采集大量数据训练检测模型,通过利用深度信息,基于传统图像处理方法即可获得商品的检测结果,节约成本,提高效率。

    一种基于深度学习的背景去除的方法

    公开(公告)号:CN110189330A

    公开(公告)日:2019-08-30

    申请号:CN201910276000.7

    申请日:2019-04-08

    Abstract: 本发明公开了一种基于深度学习的背景去除的方法。本发明包括如下步骤:步骤1、对初期数据库的建立,通过采用对COCO数据集的整理以及添加修改得到所需要的对初期数据库;并找到对初期数据库中图片原始信息匹配所对应的标签信息;对初期数据库以及其所对应的标签信息进行预处理操作,包括图像正则化和图像格式转换;步骤2、将步骤1得到的初期数据库作为原始训练数据输入到提拉米苏Tiramisu网络中,得到基本的背景去除的模型;步骤3、将待识别的图片作为输入数据输入到上述模型中进行识别,得到识别结果。本发明实现全自动化操作,只需将所需要进行操作的图片输入到模型中即可自动完成背景去除的目的。

    一种基于SRCNN的帧间预测方法

    公开(公告)号:CN110177282A

    公开(公告)日:2019-08-27

    申请号:CN201910388829.6

    申请日:2019-05-10

    Abstract: 本发明公开了一种基于SRCNN的帧间预测方法,其特征在于使用超分辨率卷积神经网络对图像序列进行帧间预测;对图像序列做运动估计和运动补偿操作后,结合超分辨率卷积神经网络训练出特征模型;使用模型中的参数对图像进行超分辨率重建,同时对图像进行运动估计和运动补偿,得到与当前图像的下一帧图像一致的图像。本发明将深度学习应用到视频编码的帧间预测,使用卷积神经网络,对图像序列间的运动估计、运动补偿操作进行特征提取和训练学习。同时,使用超分辨率神经网络,在图像重建时,图像的画质会得到增强。

    一种基于核稀疏表示的三维模型分类检索方法

    公开(公告)号:CN110083715A

    公开(公告)日:2019-08-02

    申请号:CN201910212744.2

    申请日:2019-03-20

    Abstract: 本发明公开了一种基于核稀疏表示的三维模型分类检索方法。本发明步骤如下:1、运用一种基于二次误差作为度量代价的边收缩算法对以点云形式表示的三维模型进行顶点简化处理;2、计算顶点简化后三维模型的方向,保证同类模型在方向上能够对齐,通过计算得到了三维模型的三个特征方向向量;3、基于三个特征方向向量对三维模型进行渲染,得到相应不同方向上的多张不同渲染图像;4、针对不同数据集中三维模型的特点,综合考虑数据特征与描述符特征,选定特征描述符提取渲染图像的特征;5、利用改进的核稀疏表示分类器对提取的特征向量进行匹配,进而实现对三维模型的分类检索工作。本发明具有一定的鲁棒性,取得了较为高效、可靠的优越性能。

    一种基于多视图的三维模型分类检索方法

    公开(公告)号:CN110059205A

    公开(公告)日:2019-07-26

    申请号:CN201910213225.8

    申请日:2019-03-20

    Abstract: 本发明提出了一种基于多视图的三维模型分类检索方法。本发明具体实现如下:1、将三维模型数据进行预处理;2、获取三维模型的多角度渲染视图,在12个不同的视点处对三维模型进行投影得到其相应角度的渲染视图;3、提取三维模型渲染视图的特征,将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征;4、利用SVM分类器对三维模型进行分类检索。本发明方法通过一系列的预处理后,渲染得到三维模型不同角度下的视图,然后利用改进过的多分类SVM分类器实现了针对三维模型的分类检索任务,具有一定的鲁棒性,取得了较为高效、可靠的优越性能。

    一种基于图模型的图像压缩感知方法

    公开(公告)号:CN109451314A

    公开(公告)日:2019-03-08

    申请号:CN201810368095.0

    申请日:2018-04-23

    Abstract: 本发明公开了一种基于图模型的图像压缩感知方法。本发明包括:1:设置QP因子,对测试图像X进行压缩得到图片X',并将压缩后的图片与原始图片的PSNR值进行比较;2:将压缩后的图片X'分成若干重叠小块,对于每个小块构造相似块组,并进行平均;步骤3:将待重建的压缩平均块中的每一个像素看成是一个节点,构造对应的图模型;4:将图作为正则项,将原始块与待重建的压缩平均块的偏差作为二次项,对表达式进行凸优化处理求解;5:对每个重叠小块处理完后,采用加权平均对图片进行更新,得到压缩重建后的图片Y,并计算原始图片与处理完后的图片的PSNR值,并与传统图像压缩感知方法进行比较。本发明提高图像的压缩效率以及重建速率。

    一种用于在线不平衡流数据的分类方法

    公开(公告)号:CN109101993A

    公开(公告)日:2018-12-28

    申请号:CN201810732704.6

    申请日:2018-07-05

    Abstract: 本发明公开了一种用于在线不平衡流数据的分类方法,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值;步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新。采用本发明技术方案,即解决了传统在线分类方法无解解决的不平衡流数据分类问题,同时提高了分类精度。

    基于深度学习的手势识别的多标签图像预处理方法

    公开(公告)号:CN108898045A

    公开(公告)日:2018-11-27

    申请号:CN201810366869.6

    申请日:2018-04-23

    Abstract: 本发明公开了一种基于深度学习的手势识别的多标签图像预处理方法。本发明步骤如下:1.获取已标记的多个特征点的坐标;2.在坐标中选出图像平面坐标系中x的最大和最小值,y的最大和最小值,确认坐标点A(xmin,ymin)和坐标点B(xmax,ymax);3.利用坐标A和B定位目标在图像中标签有效的方形区域P,同时在区域P边缘的坐标点应按规则留有余量,从而得到拓展后的方形区域P1,并对区域P1的长和宽更新;4.比较区域P1的长和宽从而得到一个新的方形区域P2;5.计算裁剪图中特征点的坐标,作为裁剪图的标签。本发明在原图像中裁剪出包含目标的正方形图像,尽可能少的添加通道,减少背景冗余度,保留目标特征。

Patent Agency Ranking