移动端CPU实时多功能人脸检测方法

    公开(公告)号:CN112232205B

    公开(公告)日:2022-05-27

    申请号:CN202011106815.X

    申请日:2020-10-16

    发明人: 严安 周治尹

    IPC分类号: G06V40/16 G06N3/04 G06N3/08

    摘要: 本发明属于人脸识别技术领域,具体涉及一种实时多功能人脸检测方法。移动端CPU实时多功能人脸检测方法,包括:将图片放入预设的检测器中进行预测,通过检测器进行识别,得到人脸框预测值、人脸关键点和口罩识别结果;将人脸框预测值进行解码操作,转换为边界框的真实位置,将人脸关键点进行解码操作,转换为关键点的真实位置;采用非极大值抑制算法消除重叠检测框,得到最终的人脸检测框、人脸关键点和口罩识别结果。本发明在移动端只有CPU的情况下达到实时检测效果。

    红外弱小目标的检测方法、装置及服务器

    公开(公告)号:CN112686895B

    公开(公告)日:2021-05-18

    申请号:CN202110265422.1

    申请日:2021-03-11

    发明人: 文丁 季翔宇 李源

    摘要: 本申请实施例提供一种红外弱小目标的检测方法、装置及服务器,通过获取红外成像视频流中第一连续帧数据序列中满足预设条件的第二连续帧数据序列,然后提取其每帧图像数据中与红外弱小目标相关的健壮特征点后,构建健壮特征点在第二连续帧数据序列的数据方向上对应的疑似运动目标轨迹,并从疑似运动目标轨迹中筛选红外弱小目标的真实目标运动轨迹,之后基于真实目标运动轨迹从第二连续帧数据序列中提取出红外弱小目标的目标轮廓信息。如此,基于连续帧数据序列快速定位运动目标的真实目标运动轨迹,并基于真实目标运动轨迹进行目标轮廓的局部区域分割的方式,能够降低计算复杂度,满足实时性的要求,并且目标轮廓的提取精度更高。

    多角度稠密目标检测抑制优化方法及设备

    公开(公告)号:CN111310824A

    公开(公告)日:2020-06-19

    申请号:CN202010091184.2

    申请日:2020-02-13

    发明人: 龚飞

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明的目的是提供一种多角度稠密目标检测抑制优化方法及设备,本申请的抑制原理结合了目标边界框的交并比IOU和距离信息,这种判别方式对同一目标的边界框做出了明确的划分,对冗余的预测结果进行了更加合理的抑制处理,有效避免原始NMS算法对多角度稠密目标在旋转、紧贴等情况下的误抑制操作,减少漏检和误检,提升了模型的实际应用能力。本申请可具体应用于商品检测与识别。

    基于深度学习的厨师帽和口罩佩戴的检测方法

    公开(公告)号:CN111062429A

    公开(公告)日:2020-04-24

    申请号:CN201911273796.7

    申请日:2019-12-12

    摘要: 本发明提供了一种基于深度学习的厨师帽和口罩佩戴的检测方法,包括:采集包括厨房场景内的人头图像;对所述人头图像进行预处理,构建人头检测数据集;将所述训练集放入卷积特征器提取包括所述厨师帽和所述口罩相关的特征,通过K-means聚类方法产生Anchor box个数来生成预测的人头边界框,并通过候选框与真实框的交并比为评价标准;将所述训练集数据输入YOLOv3网络进行重复训练,获得卷积层的权重值和偏置值,输出所述训练集数据的损失函数值;将所述训练好的模型进行模型压缩到满足实时检测条件时进行检测,根据所述训练好的模型检测所述人头图像,分别输出包括厨师帽和口罩的预测边界框和类别的结果。

    人脸校准方法及设备
    5.
    发明授权

    公开(公告)号:CN112001268B

    公开(公告)日:2024-01-12

    申请号:CN202010759579.5

    申请日:2020-07-31

    发明人: 孟彦达 杨晓云

    摘要: 本发明的目的是提供一种人脸校准方法及设备,本发明的聚合体系结构与分层和迭代融合功能密切相关。本发明提出了一种新颖的聚合回归网络,该网络可以更好地提取跨渠道和分辨率的语义和空间信息的全谱。本发明的网络由一个编码器和一个解码器组成,它们通过一系列嵌套的残差卷积块相连。本发明门设计了解码器中每个降采样操作之后剩余的顶点数,以及编码器中每个卷积块之后的特征图大小,以使它们彼此相等。因此,本发明通过不同的特征级别实现了从2D图像特征到3D网格特征的体积回归。

    目标检测模型处理方法、装置及电子设备

    公开(公告)号:CN116740502A

    公开(公告)日:2023-09-12

    申请号:CN202310746998.9

    申请日:2023-06-21

    发明人: 唐华阳 李源

    摘要: 本申请提供的目标检测模型处理方法、装置及电子设备,先通过第一样本集合中的大量已标注样本对目标检测模型进行第一阶段训练,使所述目标检测模型在具有一定分类能力的同时具有识别前景目标的能力,再使用少量标注的新增分类的第二样本对目标检测模型进行第二阶段训练,在第二阶段训练中,不调整特征提取网络的网络参数,仅调整分类分支的分类权重,从而在保留了第一阶段训练获得的特征提取能力的情况下,将所述目标检测模型迅速调整为可以对新增的分类进行目标识别。如此,在不需要采用复杂模型结构的情况下可以实现使用小样本训练目标检测模型。

    喷淋设备控制方法、装置及电子设备

    公开(公告)号:CN116152732A

    公开(公告)日:2023-05-23

    申请号:CN202211624439.2

    申请日:2022-12-16

    发明人: 黄奇 李源

    摘要: 本申请提供一种喷淋设备控制方法、装置及电子设备,所述方法包括:获取待处理图像;从所述待处理图像中确定出预设检测区域;获取所述预设检测区域中各像素的暗通道值;将所述暗通道值大于设定阈值的像素确定为目标像素;根据所述目标像素的数量与所述预设检测区域中像素总数量的比值,确定喷淋设备的工作状态,并根据所述喷淋设备的工作状态控制所述喷淋设备。如此,相较于使用深度学习识别的方式,本申请提供的方案可以实现低成本喷淋设备检测控制,并且高鲁棒性高,易于部署。

    图像数据的神经网络训练和测试方法及设备

    公开(公告)号:CN111950727B

    公开(公告)日:2022-10-04

    申请号:CN202010785373.X

    申请日:2020-08-06

    发明人: 张敏文 周治尹

    IPC分类号: G06N3/08

    摘要: 本发明的目的是提供一种图像数据的神经网络训练方法和测试及设备,本发明使用YUV图像格式数据进行神经网络的离线学习和在线测试,送入到神经网络中的图像亮度信息或者图像色彩信息,是正交化最好的亮度信息和色彩信息。本发明直接使用YUV格式的视频数据全部分量数据训练神经网络,可以比用RGB格式训练神经网络节省图像格式转换时间。当神经网络处理的对象是网络摄像头抓取的图像数据或者是视频流数据时,本发明能够避免图像格式转换带来的额外计算量,提高时间效率。本发明能够保证在RGB格式下训练的神经网络精度,同时提高算法的整体效率。

    基于红外图像的活体检测方法

    公开(公告)号:CN112232204B

    公开(公告)日:2022-07-19

    申请号:CN202011106811.1

    申请日:2020-10-16

    发明人: 严安 周治尹

    IPC分类号: G06V40/16 G06V40/40 G06N3/08

    摘要: 本发明属于人脸识别技术领域,具体涉及一种实时多功能人脸检测方法。基于红外图像的活体检测方法,包括:采集红外图片并进行预处理操作;将图片放入检测器中进行预测,得到人脸框预测值、人脸关键点和口罩识别结果;将人脸框预测值和人脸关键点进行解码操作;采用阈值为0.4的非极大值抑制算法消除重叠检测框,得到最终的人脸检测框、人脸关键点和口罩识别结果;根据人脸关键点提取两只眼睛坐标x和y,将x和y分别向四个方向延伸预设像素后得到眼部图像;采用活体识别神经网络判断眼部图像是否为活体,得到判断结果。本发明能在移动端只有CPU的情况下达到实时检测效果,准确检测出眼部位置。

    一种移动端实时人脸姿态估计方法

    公开(公告)号:CN112507848A

    公开(公告)日:2021-03-16

    申请号:CN202011396378.X

    申请日:2020-12-03

    发明人: 严安 周治尹

    IPC分类号: G06K9/00 G06N3/04

    摘要: 本申请提供一种移动端实时人脸姿态估计方法,该方法包括以下步骤:获取待检测图片,对待检测图片进行预处理;检测器加载预训练网络的参数,生成默认锚点;将预处理好的图片放入检测器中进行预测,使用主干网络中最后一个卷积层的特征与锚点相结合的方法进行关键点检测;将检测器得到的人脸框预测值和人脸关键点进行解码操作;采用阈值为0.4的NMS算法消除重叠检测框,得到人脸检测框、人脸关键点;分别计算人脸姿态偏航角()、俯仰角()和翻滚角()。在上述的实现过程中,本申请采用二维图像三个人脸关键点计算人脸的姿态信息,无需通过人脸三维坐标信息,同时避免了当人脸出现遮挡物如口罩等无法计算人脸姿态信息的问题,较神经网络计算量小,实时性高。