一种基于实时手势识别的手心追踪定位的方法

    公开(公告)号:CN108846356A

    公开(公告)日:2018-11-20

    申请号:CN201810596897.7

    申请日:2018-06-11

    Abstract: 本发明公开一种基于实时手势识别的手心追踪定位的方法。该方法首先对输入视频进行分割视频帧和图像预处理,然后通过动态阈值背景法检测算法抽取部分视频帧建立背景模,在此基础上利用YCrCb色彩空间肤色分割算法分割出手势图像,最后通过采用生物学的优化手心定位方法对手势跟踪定位后实现手势识别。本发明方法避免了误检视频中类肤色区域,提高了手势跟踪准确度和鲁棒性。

    基于ResNet50的垃圾识别与分类方法

    公开(公告)号:CN115019173B

    公开(公告)日:2024-11-22

    申请号:CN202210661728.3

    申请日:2022-06-13

    Inventor: 倪晓军 刘玲

    Abstract: 本发明属于图像识别技术领域,具体地说,是一种基于ResNet50的垃圾识别与分类方法,包括:选取涵盖有实际生活中常见的多种垃圾图片的公开数据集,创建成适合垃圾分类研究所需要的数据集,然后将数据集分为训练集与测试集,对训练集中的图像进行预处理操作;搭建网络模型,选取ResNet50卷积神经网络模型作为基准模型,引入深度可分离卷积,添加CBMA和SE两种注意力机制,从而创建出新型卷积神经网络模型;设置网络模型的超参数,选择损失函数和优化方法对创建出的网络模型进行训练,可得到训练好的模型;利用训练好的卷积神经网络模型去识别测试集中的图片,最后得到识别的精度。

    一种基于多维融合特征的视频群体人物定位检测方法

    公开(公告)号:CN109903339B

    公开(公告)日:2021-03-05

    申请号:CN201910235608.5

    申请日:2019-03-26

    Abstract: 本发明公开一种多维融合特征的视频群体人物定位检测方法。该发明首先抽取多层级视频特征图,建立自顶向下和自底向上的双向特征处理通道充分挖掘视频的语义信息,接着融合多层级视频特征图获取多维融合特征,抓取视频候选目标,最后并行处理候选目标位置回归和类别分类,完成视频群体人物定位检测。本发明通过融合多层级特征获得丰富的视频语义信息,同时进行多任务预测操作,有效提升群体人物定位检测的速度,具有良好的准确率和实施性。

    一种基于特征关联的视频群体人物运动轨迹跟踪方法

    公开(公告)号:CN111105443A

    公开(公告)日:2020-05-05

    申请号:CN201911362575.7

    申请日:2019-12-26

    Abstract: 本发明公开了一种基于特征关联的视频群体人物运动轨迹跟踪方法。该发明首先检测视频中出现的群体人物,获取群体人物的位置信息和特征掩码;接着检测新增人物,选定当前追踪人物,逐帧计算当前追踪人物与相邻视频帧中人物的关联相似度;最后结合关联相似度,确定当前追踪人物的帧间动态,更新当前追踪人物运动线索,并遍历视频序列完成视频群体人物的运动轨迹跟踪。本发明利用群体人物的运动特性,在帧间人物关联匹配过程中,综合考虑位置关系和动作形态的影响,能够有效提高群体人物运动轨迹跟踪的准确率,具有良好的实施性和鲁棒性。

    一种基于视频人物唇读识别的时序集中预测方法

    公开(公告)号:CN111753704A

    公开(公告)日:2020-10-09

    申请号:CN202010562822.4

    申请日:2020-06-19

    Abstract: 本发明公开一种基于视频人物唇读识别的时序集中预测方法,首先输入人物唇动视频帧序列并提取唇部的时空特征,采用嵌入了SENet模块的残差网络获取多通道下人物唇部的有用特征,将特征输入双向门控循环单元得到唇动轮廓所对应字符的概率分布,并引入连接主义者的时间分类算法对齐时间步长上的各文本标签和字符;接着针对前后时序关系,利用双向门控循环单元的隐藏状态,建立时序关联的注意力窗口以集中成上下文向量,对该上下文向量在注意力窗口长度下的概率分布向量再次细分规划;最后对每个当前时间的概率分布向量设置注意力单元并重新汇集为能够预测唇读对应字符的概率。本发明通过对时序信息的前后集中关联,能有效预测和识别视频中人物唇读内容。

    一种基于级联特征提取的唇部检测及读取方法

    公开(公告)号:CN108710836A

    公开(公告)日:2018-10-26

    申请号:CN201810422275.2

    申请日:2018-05-04

    Abstract: 本发明公开一种基于级联特征提取的唇部检测及读取方法。该发明首先对输入视频的唇部区域进行检测,通过基于哈尔分类器和自适应推进算法的维奥拉琼斯方法实现唇部区域检测;然后先根据唇区色彩特征对检测区域进行阈值二值化以实现唇区提取,对唇区图像进行离散余弦变换,将视频图像信息集中于数据矩阵的某一区域,采取合适的筛选方式提取数据;然后通过主成分分析算法对贡献值较大的多个特征值进行维度提取,使数据进一步降维;根据一定规模的数据样本建立用于识别的序列字典树,使用莱文斯坦距离进行序列的相似度分析和模糊匹配;最后将每帧的静态特征与视频的动态特征相结合进行动态序列查询从而完成唇区的读取。本发明通过对唇区图像特征的多级提取和降维,能够提升唇读的速度和准确性,具有良好的实施性和鲁棒性。

    基于图像人物面部表情识别的特征提取优化方法

    公开(公告)号:CN108446640A

    公开(公告)日:2018-08-24

    申请号:CN201810237230.8

    申请日:2018-03-21

    Abstract: 本发明公开了一种基于图像人物面部表情识别的特征提取优化方法。该发明首先输入面部图像并用矩阵的形式表示,设置投影轴后,得到投影特征向量。设定给定图像的投影特征协方差矩阵,并以其迹表示最佳投影方向函数。根据训练样本图像的总体散布矩阵更新最佳投影方向函数,满足此函数最大值的投影轴组成的向量集合更新投影特征向量,并组成表示表情特征的矩阵。接着将特征矩阵中的每个元素再赋予权值,通过经高斯变异修改过的粒子群算法,优化最佳投影方向即全局最优解。最后把粒子群算法中的全局最优解分成二级群体,分为领导者和跟随者表示图像人物面部表情的多个主要部位进行二次优化和识别。该发明能够有效的辨别和优化人物面部的表情特征果。

    一种基于实时手势识别的手心追踪定位的方法

    公开(公告)号:CN108846356B

    公开(公告)日:2023-04-07

    申请号:CN201810596897.7

    申请日:2018-06-11

    Abstract: 本发明公开一种基于实时手势识别的手心追踪定位的方法。该方法首先对输入视频进行分割视频帧和图像预处理,然后通过动态阈值背景法检测算法抽取部分视频帧建立背景模型,在此基础上利用YCrCb色彩空间肤色分割算法分割出手势图像,最后通过采用生物学的优化手心定位方法对手势跟踪定位后实现手势识别。本发明方法避免了误检视频中类肤色区域,提高了手势跟踪准确度和鲁棒性。

    基于子群组划分与动量特征融合的人群运动行为识别方法

    公开(公告)号:CN109064484B

    公开(公告)日:2022-02-08

    申请号:CN201810236397.2

    申请日:2018-03-21

    Abstract: 本发明公开了一种基于子群组划分与动量特征融合的人群运动行为识别方法,该方法首先利用角点跟踪和背景建模的方法,获取视频图像帧中运动目标的时空信息,利用前景中群体分布的空间区域信息,将空间上相邻近的人群划分为若干子群体,子群体通过一段时间内的运动相关性进行进一步的分割,得到具有运动一致性的子群体;其次在子群体分割的基础上,提取出人群运动三个动量特征进行融合;最后将融合的特征以及视频帧的像素特征作为微分循环卷积神经网络的输入进行训练,采用人工标记的方法将训练视频片段标记成不同的描述词汇,用带标记的数据调整微分循环卷积神经网络的结果,得到了良好的训练成果,能够有效识别人群的运动行为,达到较好的效果。

    一种基于卷积自编码模型的唇部特征提取方法

    公开(公告)号:CN110163156A

    公开(公告)日:2019-08-23

    申请号:CN201910437384.6

    申请日:2019-05-24

    Abstract: 本发明公开一种基于卷积自编码模型的唇部特征提取方法,该发明首先通过对用户输入的视频逐帧提取唇部区域;然后对每帧唇部区域图像进行处理;处理完成后利用卷积自编码模型来提取唇部区域图像特征,最后将特征输入到LSTM进行训练,LSTM根据输入的特征对单词进行分类,从而完成对唇部的读取。本发明通过对唇部图像的压缩与重构,有助于帮助我们从唇部图像中提取视觉特征,从而得到更准确的潜在表示空间,能够有效提升唇读的准确性与可靠性。

Patent Agency Ranking