-
公开(公告)号:CN112001268B
公开(公告)日:2024-01-12
申请号:CN202010759579.5
申请日:2020-07-31
申请人: 中科智云科技有限公司 , 上海点泽智能科技有限公司
IPC分类号: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/0464
摘要: 本发明的目的是提供一种人脸校准方法及设备,本发明的聚合体系结构与分层和迭代融合功能密切相关。本发明提出了一种新颖的聚合回归网络,该网络可以更好地提取跨渠道和分辨率的语义和空间信息的全谱。本发明的网络由一个编码器和一个解码器组成,它们通过一系列嵌套的残差卷积块相连。本发明门设计了解码器中每个降采样操作之后剩余的顶点数,以及编码器中每个卷积块之后的特征图大小,以使它们彼此相等。因此,本发明通过不同的特征级别实现了从2D图像特征到3D网格特征的体积回归。
-
公开(公告)号:CN112001268A
公开(公告)日:2020-11-27
申请号:CN202010759579.5
申请日:2020-07-31
申请人: 中科智云科技有限公司 , 上海点泽智能科技有限公司
摘要: 本发明的目的是提供一种人脸校准方法及设备,本发明的聚合体系结构与分层和迭代融合功能密切相关。本发明提出了一种新颖的聚合回归网络,该网络可以更好地提取跨渠道和分辨率的语义和空间信息的全谱。本发明的网络由一个编码器和一个解码器组成,它们通过一系列嵌套的残差卷积块相连。本发明门设计了解码器中每个降采样操作之后剩余的顶点数,以及编码器中每个卷积块之后的特征图大小,以使它们彼此相等。因此,本发明通过不同的特征级别实现了从2D图像特征到3D网格特征的体积回归。
-
公开(公告)号:CN111062429A
公开(公告)日:2020-04-24
申请号:CN201911273796.7
申请日:2019-12-12
申请人: 上海点泽智能科技有限公司
摘要: 本发明提供了一种基于深度学习的厨师帽和口罩佩戴的检测方法,包括:采集包括厨房场景内的人头图像;对所述人头图像进行预处理,构建人头检测数据集;将所述训练集放入卷积特征器提取包括所述厨师帽和所述口罩相关的特征,通过K-means聚类方法产生Anchor box个数来生成预测的人头边界框,并通过候选框与真实框的交并比为评价标准;将所述训练集数据输入YOLOv3网络进行重复训练,获得卷积层的权重值和偏置值,输出所述训练集数据的损失函数值;将所述训练好的模型进行模型压缩到满足实时检测条件时进行检测,根据所述训练好的模型检测所述人头图像,分别输出包括厨师帽和口罩的预测边界框和类别的结果。
-
公开(公告)号:CN110827292B
公开(公告)日:2021-08-10
申请号:CN201911013997.3
申请日:2019-10-23
申请人: 中科智云科技有限公司
摘要: 本申请的目的是提供一种基于卷积神经网络的视频实例分割方法及设备,本申请通过获取视频序列并确定待检测目标对象;通过跟踪器对视频序列进行目标对象的跟踪,得到视频序列中的目标对象的跟踪结果;判断跟踪结果是否大于跟踪阈值,若是,则将跟踪结果确定为目标对象的分类结果,若否,则对视频序列重新进行分类检测,以得到目标对象的重分类结果,通过对视频序列中的目标对象进行跟踪得到跟踪结果,并对跟踪结果进行分类结果准确度判定,若不符合准确度要求则对视频序列重新进行分类检测,以得到更为精确的视频序列的目标对象的分类结果,实现了对整个视频序列的目标对象的分类,提高了视频实例分割处理的性能和视频分割的准确度。
-
公开(公告)号:CN110827292A
公开(公告)日:2020-02-21
申请号:CN201911013997.3
申请日:2019-10-23
申请人: 中科智云科技有限公司
摘要: 本申请的目的是提供一种基于卷积神经网络的视频实例分割方法及设备,本申请通过获取视频序列并确定待检测目标对象;通过跟踪器对视频序列进行目标对象的跟踪,得到视频序列中的目标对象的跟踪结果;判断跟踪结果是否大于跟踪阈值,若是,则将跟踪结果确定为目标对象的分类结果,若否,则对视频序列重新进行分类检测,以得到目标对象的重分类结果,通过对视频序列中的目标对象进行跟踪得到跟踪结果,并对跟踪结果进行分类结果准确度判定,若不符合准确度要求则对视频序列重新进行分类检测,以得到更为精确的视频序列的目标对象的分类结果,实现了对整个视频序列的目标对象的分类,提高了视频实例分割处理的性能和视频分割的准确度。
-
公开(公告)号:CN112149461A
公开(公告)日:2020-12-29
申请号:CN201910568744.6
申请日:2019-06-27
申请人: 中科智云科技有限公司
摘要: 本公开的实施例提供了用于识别对象的方法、装置、设备和计算机可读存储介质。该方法包括:经由摄像装置,获取放置在第一表面上的对象的视频图像,第一表面在视频图像被获取期间被旋转预定角度;基于视频图像中的多帧图像,生成经标注的多个训练样本,多帧图像分别对应第一表面的多个不同的旋转角度;基于多个训练样本,训练识别模型,所述训练识别模型用于确定待识别图像中的待识别对象的对象类别和对象数目中的至少一项。本公开的实施例能够准确识别随意摆放的一个或多个待识别对象。
-
-
-
-
-