基于行人检测方法的多层级监控系统

    公开(公告)号:CN110139036A

    公开(公告)日:2019-08-16

    申请号:CN201910416320.8

    申请日:2019-05-17

    IPC分类号: H04N5/232 H04N7/18 H04N5/76

    摘要: 本发明公开一种基于行人检测方法的多层级监控系统,涉及数字图像处理技术以及安防监控领域。该方法通过行人检测的方法,对摄像头进行分级控制。行人检测方法利用Camshift算法,对摄像头采集到的数据进行逐帧迭代处理,通过与初始背景的差异比较,得出视频中行人位置并进行标注。分级控制,根据摄像头安装的位置关系进行逐层控制,实现在监控范围内由外及里逐层监控。该方法减少了摄像头进行数据存储所需要的存储空间,有效减少了无效数据量,同时减少了摄像头的工作时间,延长了摄像头的使用寿命。该方法能够适用于人流量较少的厂房、仓库、停车场等场所。

    一种基于计算机视觉的金属工件加工面缺陷检测方法

    公开(公告)号:CN112102278A

    公开(公告)日:2020-12-18

    申请号:CN202010950104.4

    申请日:2020-09-11

    摘要: 本发明公开一种基于计算机视觉的工件加工面缺陷检测方法。检测的缺陷包括:砂眼,划痕,磕碰伤痕。该方法以计算机视觉为基础,无需人工可以自动判断检测工件的加工面是否符合标准。通过CCD摄像机拍摄工件加工面的图像,送入计算机,对其进行图像预处理,并对检测的缺陷进行分类,不同的缺陷之后使用的检测算法不同。将预处理后的图像经过缺陷检测算法得到工件加工面磕碰伤痕、砂眼、划痕的有效信息的特征提取图像。以此特征提取图像得到砂眼,划痕,磕碰伤痕的大小信息,通过与设定的阈值比较,检测工件加工面是否存在缺陷以及缺陷是否导致工件不合格。该检测方法成本低,效率高,可应用于工厂生产的各种环形工件的加工面缺陷检测。

    一种基于人机交互的虚拟拍照综合系统及方法

    公开(公告)号:CN110933290A

    公开(公告)日:2020-03-27

    申请号:CN201910387014.6

    申请日:2019-05-08

    摘要: 本发明公开一种基于人机交互的虚拟拍照综合系统及方法,涉及KinectV2.0硬件开发与人机交互领域。该方法可通过姿态、语音控制两种手段对虚拟拍照系统进行控制。姿态控制方法,使用人体骨骼夹角变化以及静态时人体姿态持续时间作为控制依据,具有较高的鲁棒性。语音控制方法,通过实时语音输入,经预处理后与语音库进行比对实现语音控制。虚拟拍照系统使用任意一张图片作为背景,使实际人物融合在背景中,实现虚拟照片的拍摄。具体过程包括:相机标定、背景选取、初步虚拟背景融合、色彩匹配。本发明立足人机交互,控制方法新颖,应用范围广,可提供自助式拍摄体验,可应用于博物馆、科技馆等活动的宣传、推广等方面。

    一种基于轻量化网络的小样本钢材表面缺陷分类方法

    公开(公告)号:CN114120066B

    公开(公告)日:2024-05-17

    申请号:CN202111473156.8

    申请日:2021-12-06

    发明人: 林丽媛 王颖 张顺

    摘要: 本发明公开一种基于轻量化网络的小样本钢材表面缺陷分类方法,涉及表面缺陷分类技术领域。该方法选取MobileNetV2为轻量化基准网络,通过通道混洗操作和注意力加权网络进行模型优化,增加组间信息交流,自适应标定特征权重。同时,提出离线数据增强算法,扩充小样本缺陷数据,解决样本不平衡问题。本发明具有强大的缺陷分类能力,模型参数量小,检测速度快,满足实际工业部署和实时性需求,降低了检测硬件的配置需求。

    一种基于深度学习的人体姿态识别方法

    公开(公告)号:CN109086754A

    公开(公告)日:2018-12-25

    申请号:CN201811177283.1

    申请日:2018-10-11

    IPC分类号: G06K9/00 G06K9/62 G06N3/04

    摘要: 本发明公开一种基于深度学习的人体姿势识别方法,主要解决当前姿势识别技术计算量大,准确度不高的问题。该方法首先用Kinect V2.0深度传感器采集多个人体样本的动作姿态特征;保存其人体动作姿势的RGB数据和骨骼数据;把骨骼数据经过图像预处理后得到骨骼图像作为训练集与测试集;将训练集输入一种基于卷积神经网络(CNN)的专用于人体姿态识别领域的Posture-CNN中,经过训练、测试调整网络结构和网络参数后得到分类结果;并将不同人体样本的动作姿态特征作为测试集输入分类网络,输出概率最大的动作即为识别结果。本发明使用卷积神经网络提高了识别准确率,降低了识别时间、运行成本低、方法简便可以应用在智能家居、安全监控、运动分析等场所。

    一种面向自动驾驶场景的基于深度学习的语义分割方法

    公开(公告)号:CN112508977A

    公开(公告)日:2021-03-16

    申请号:CN202011585194.8

    申请日:2020-12-29

    摘要: 本发明公开一种面向自动驾驶场景的基于深度学习的语义分割方法,主要解决当前街景图像语义分割技术中计算量大,分割准确率不高的问题。该方法以Cityscapes和Camvid数据集作为训练集和测试集,在Tensorflow环境中对数据集进行预处理,然后以改进的Xception分类模型为主干网络,对复杂场景图像中目标对象进行特征提取,将Xception识别处理的结果送到DeeplabV3+中进行语义分割,经过训练、测试调整网络参数后,得到分割结果。本发明以改进的Xception作为分类网络模型提高了图像目标识别、分割的准确率,降低了识别时间和经济成本,可以应用在自动驾驶、军事等领域中。

    一种基于深度学习与运动目标检测的人体行为动作识别方法

    公开(公告)号:CN112464844A

    公开(公告)日:2021-03-09

    申请号:CN202011414440.3

    申请日:2020-12-07

    摘要: 本发明公开了一种基于深度学习与运动目标检测相结合的人体行为动作识别方法,主要解决当前人体行为动作识别的准确率不高,且易受外界条件干扰等问题。该方法利用运动目标检测(帧差法)来捕捉视频场景里人物动作图像,经图像增强,高斯滤波,形态学去噪等预处理建立人体动作图像数据集,并在该数据集上训练基于3DCNN+ConvLSTM的神经网络模型;将经过训练后的3DCNN+ConvLSTM模型进行测试,实验结果在复杂场景里能够准确而有效识别各种人体动作,该方法针对KTH数据集的6种动作达到了92%的准确率,超过了现有其他方法识别的准确率,且收敛速度快,运行成本低,容易实现,可以广泛应用于智能家居,安全监控,运动分析等。

    基于外接矩形的实时瞳孔定位方法

    公开(公告)号:CN112162629A

    公开(公告)日:2021-01-01

    申请号:CN202010950105.9

    申请日:2020-09-11

    摘要: 本发明涉及一种基于外接矩形的实时瞳孔定位方法,该方法利用瞳孔面积筛选结合两种不同的瞳孔外接矩形长宽比、角度差提取瞳孔特征,进一步精确定位瞳孔,最后通过瞳孔重心坐标与原图像拟合获得准确的瞳孔定位。实验结果表明该方法准确率能达到99.5%,有效解决了瞳孔定位中睫毛遮挡,眼部黑痣干扰和眼角部分阴影干扰等系列问题,具有实时性和良好的鲁棒性良。因此可以广泛应用于眼球追踪、视线分析等方面的研究,有助于人机交互和心理学研究的发展。

    一种基于轻量化网络的小样本钢材表面缺陷分类方法

    公开(公告)号:CN114120066A

    公开(公告)日:2022-03-01

    申请号:CN202111473156.8

    申请日:2021-12-06

    发明人: 林丽媛 王颖 张顺

    摘要: 本发明公开一种基于轻量化网络的小样本钢材表面缺陷分类方法,涉及表面缺陷分类技术领域。该方法选取MobileNetV2为轻量化基准网络,通过通道混洗操作和注意力加权网络进行模型优化,增加组间信息交流,自适应标定特征权重。同时,提出离线数据增强算法,扩充小样本缺陷数据,解决样本不平衡问题。本发明具有强大的缺陷分类能力,模型参数量小,检测速度快,满足实际工业部署和实时性需求,降低了检测硬件的配置需求。

    一种基于深度学习的戴口罩人脸表情识别方法

    公开(公告)号:CN111738178A

    公开(公告)日:2020-10-02

    申请号:CN202010595512.2

    申请日:2020-06-28

    发明人: 林丽媛 韦赛远

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明公开一种基于深度学习的戴口罩人脸识别方法,主要解决当前戴口罩人脸表情识别技术数据集缺乏、准确率较低以及相关研究过少的问题。该方法首先基于Fer2013无遮挡表情数据集,结合Dlib库68个人脸关键点检测技术中的27个关键点建立3841张规格为48*48*1的有遮挡(戴口罩)4类表情类别数据集,随机分为训练集与测试集;将训练集输入一种基于卷积神经网络的专用于人脸表情识别领域的M-Xception网络中进行训练,保存参数权重,可利用测试集测试模型准确率;利用OpenCV实时采集戴口罩人脸图像,将不同表情的戴口罩人脸图像输入模型,输出概率最大的表情即为识别结果。本发明使用卷积神经网络提高了识别准确率,降低了识别时间、运行成本低、方法简便,可以应用在商场购物体验、健康状态分析等场景。