-
公开(公告)号:CN117528085A
公开(公告)日:2024-02-06
申请号:CN202410020281.0
申请日:2024-01-08
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: H04N19/124 , H04N19/132 , H04N19/88 , H04N19/91 , G06T9/00 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/0895
摘要: 本发明公开了一种基于智能特征聚类的视频压缩编码方法,包括以下步骤:步骤1、将视频进行预处理后利用深度学习模型对视频进行智能特征提取;步骤2、采用特征聚类算法对提取出的特征进行聚类,将相似或冗余的特征整合在一起,为后续编码提供更有效的数据结构;步骤3、对聚类后的特征集进行编码,通过视觉增强和数据压缩的联合制定来进行视频压缩;步骤4、在解码端,根据编码数据和聚类中心信息,恢复出原始的特征集;步骤5、利用深度学习模型的重建模块,根据解码后的特征集重建原始视频。本发明能够准确有效地进行特征提取和压缩编码,同时具有较高的压缩比和图像质量。
-
公开(公告)号:CN117612142A
公开(公告)日:2024-02-27
申请号:CN202311520633.0
申请日:2023-11-14
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: G06V20/59 , G06V10/764 , G06V10/774 , G06V10/80 , G06V40/16 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于多任务联合模型的头部姿态与疲劳状态检测方法,包括以下步骤:在YOLOv6的基础上,设计基于聚集与分流机制的加强特征提取网络;在模型中增加融合大核注意力机制的头部姿态估计分支;对人脸数据集标注形成疲劳驾驶数据集;通过目标检测损失函数和头部姿态估计损失函数训练疲劳分神检测模型;将模型部署于车载终端设备,通过模型检测头部姿态和疲劳状态并输出信息;通过某一类别持续时间与设定阈值进行比较来判定是否处于疲劳状态或分神状态。本发明提高模型的泛化性能、鲁棒性、可靠性及检测精度、减少模型训练的时间和计算资源,提高驾驶员的安全性,减少驾驶中的疲劳分心行为,降低交通事故的发生率。
-
公开(公告)号:CN117541865B
公开(公告)日:2024-06-04
申请号:CN202311517773.2
申请日:2023-11-14
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/25 , G06N3/0464
摘要: 本发明公开了一种基于粗粒度深度估计的身份分析和手机使用检测方法,包括以下步骤:设计位置估计模型,准备数据集;将数据集输入位置估计模型中进行训练;通过训练后的模型检测车内人员和手机并输出检测信息,输出信息包括目标类别、检测框及深度信息;对于车内所有检测到的人员通过联合深度信息的粗粒度深度值和感兴趣区域的方法来判定身份;对于所有检测到的手机通过联合深度信息的粗粒度深度值和距离驾驶员检测框中心点的距离的方法来判定驾驶员是否使用手机。本发明可准确区分车内人员身份,判断驾驶员是否使用手机,满足对于驾驶人员行为不同的检测需求,有助于提高驾驶的安全性。
-
公开(公告)号:CN117541865A
公开(公告)日:2024-02-09
申请号:CN202311517773.2
申请日:2023-11-14
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/25 , G06N3/0464
摘要: 本发明公开了一种基于粗粒度深度估计的身份分析和手机使用检测方法,包括以下步骤:设计位置估计模型,准备数据集;将数据集输入位置估计模型中进行训练;通过训练后的模型检测车内人员和手机并输出检测信息,输出信息包括目标类别、检测框及深度信息;对于车内所有检测到的人员通过联合深度信息的粗粒度深度值和感兴趣区域的方法来判定身份;对于所有检测到的手机通过联合深度信息的粗粒度深度值和距离驾驶员检测框中心点的距离的方法来判定驾驶员是否使用手机。本发明可准确区分车内人员身份,判断驾驶员是否使用手机,满足对于驾驶人员行为不同的检测需求,有助于提高驾驶的安全性。
-
公开(公告)号:CN117612142B
公开(公告)日:2024-07-12
申请号:CN202311520633.0
申请日:2023-11-14
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: G06V20/59 , G06V10/764 , G06V10/774 , G06V10/80 , G06V40/16 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于多任务联合模型的头部姿态与疲劳状态检测方法,包括以下步骤:在YOLOv6的基础上,设计基于聚集与分流机制的加强特征提取网络;在模型中增加融合大核注意力机制的头部姿态估计分支;对人脸数据集标注形成疲劳驾驶数据集;通过目标检测损失函数和头部姿态估计损失函数训练疲劳分神检测模型;将模型部署于车载终端设备,通过模型检测头部姿态和疲劳状态并输出信息;通过某一类别持续时间与设定阈值进行比较来判定是否处于疲劳状态或分神状态。本发明提高模型的泛化性能、鲁棒性、可靠性及检测精度、减少模型训练的时间和计算资源,提高驾驶员的安全性,减少驾驶中的疲劳分心行为,降低交通事故的发生率。
-
公开(公告)号:CN117528085B
公开(公告)日:2024-03-19
申请号:CN202410020281.0
申请日:2024-01-08
申请人: 中国矿业大学 , 燕园安全科技(徐州)有限公司
IPC分类号: H04N19/124 , H04N19/132 , H04N19/88 , H04N19/91 , G06T9/00 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/0895
摘要: 本发明公开了一种基于智能特征聚类的视频压缩编码方法,包括以下步骤:步骤1、将视频进行预处理后利用深度学习模型对视频进行智能特征提取;步骤2、采用特征聚类算法对提取出的特征进行聚类,将相似或冗余的特征整合在一起,为后续编码提供更有效的数据结构;步骤3、对聚类后的特征集进行编码,通过视觉增强和数据压缩的联合制定来进行视频压缩;步骤4、在解码端,根据编码数据和聚类中心信息,恢复出原始的特征集;步骤5、利用深度学习模型的重建模块,根据解码后的特征集重建原始视频。本发明能够准确有效地进行特征提取和压缩编码,同时具有较高的压缩比和图像质量。
-
公开(公告)号:CN118984361A
公开(公告)日:2024-11-19
申请号:CN202411443549.8
申请日:2024-10-16
申请人: 中国矿业大学 , 燕园智能科技(徐州)有限公司
IPC分类号: H04N5/14 , H04N5/265 , H04N5/33 , H04N19/192 , H04N19/13 , H04N19/159 , H04N19/61 , H04N5/262 , G06V10/80
摘要: 本发明公开了一种基于自适应配准的红外与微波信息视频编码融合方法,Step1、采集同一场景下红外和微波成像设备的信息片段;Step2、对采集的红外视频片段进行预处理操作,对采集的微波信息片段进行脉冲压缩并计算频率向量转化为雷达RD图的预处理操作;Step3、对红外视频帧及微波信息片段进行对齐和融合,生成融合视频帧;Step4、采用局部对比度增强技术进行后处理操作,增强图像中的细节和特征;Step5、采用H.265/HEVC将融合后的视频帧序列编码成视频文件。本发明充分利用红外与微波信息的特征,实现特殊场景下的目标可视化,确保红外和微波信息中目标物体的精准匹配和对齐,提高融合的准确性,拓宽了红外视频与微波信息视频编码融合技术的应用领域。
-
公开(公告)号:CN118413675B
公开(公告)日:2024-09-24
申请号:CN202410879262.3
申请日:2024-07-02
申请人: 中国矿业大学
摘要: 本发明公开了一种基于上下文渐进式三平面编码图像压缩算法及终端设备,具体包括:S1、通过MPEG算法将可视相机采集的视频流进行压缩,并获取编码格式为H265的可视图像;S2、通过编码器和超编码器依次将可视图像X转换为潜在张量Y和超潜在张量Z,此外使用超解码器得到表示Y的平均值和标准差;S3、通过概率计算模块使用平均值、标准差和已编码的三平面来评估值;S4、设计一个基于上下文的速率降低模块,预测每个三平面的值并通过残差块和卷积层进行融合,最后使用激活函数;S5、设计一个基于上下文的失真降低模块,在熵解码之后进行图像重构X;S6、最后,通过超解码器将改进的潜在张量进行图像重建。
-
公开(公告)号:CN118411306B
公开(公告)日:2024-09-24
申请号:CN202410888768.0
申请日:2024-07-04
申请人: 中国矿业大学
摘要: 本发明涉及本发明涉及图像处理领域,具体公开了一种图像实时可控去噪方法、系统及计算机可读介质。图像实时可控去噪方法包括:通过主干网络生成多个固定级别的噪声特征图;将这些噪声特征图作为输入送入噪声去相关模块,强化其噪声分布的正交性;对得到的零相关噪声特征图进行简单的线性插值实现可控的去噪效果;自动调整模块给出一组最优的控制参数以生成最终的去噪图像。利用上述方法,在噪声去相关过程中加强了噪声特征图的正交性,从而通过噪声特征图插值实现任意噪声级别控制,且不需要网络推理,实现了图像去噪过程的实时性与可控性。
-
公开(公告)号:CN117560494B
公开(公告)日:2024-03-19
申请号:CN202410038681.4
申请日:2024-01-11
申请人: 中国矿业大学 , 江苏比特达信息技术有限公司
IPC分类号: H04N19/132 , H04N19/177 , H04N19/172
摘要: 一种用于矿下低质视频快速增强的编码方法,步骤:利用检测摄像头获取煤矿井下多种光线条件下的低照度和低清晰度视频流数据;对获取的视频流数据进行处理,截取出低照度场景视频,构建井下低质视频数据集;通过帧插值器接收两个参考帧并进行帧插值操作生成一个参考帧;确定Gop结构,利用I帧编码器和P帧编码器分别对I帧和P帧进行编码;将参考帧作为参考,通过当前P帧编码器对输入的B帧进行编码。本发明为现有的神经P帧编解码器增加B帧编码功能,大大提高了P帧编码器对低质视频的增强编码性能,且具有很强的灵活性和泛化性;实现了对Gop结构的全面分析,提高了整体编码效率;为煤矿安全管理提供科学数据支持,提高了安全管理水平。
-
-
-
-
-
-
-
-
-