一种基于多区域数据增强的菜品识别方法

    公开(公告)号:CN114782735A

    公开(公告)日:2022-07-22

    申请号:CN202210163468.7

    申请日:2022-02-22

    摘要: 本发明一种基于多区域数据增强的菜品识别方法,在传统的菜品识别方法的基础上,对训练的过程中的每一张输入图像进行多区域数据增强;所述多区域增强方法分别由两步完成,第一步将输入图像从水平维度以及竖直维度平均裁剪为四等份,第二步选择每两个相邻的1/4等份分别做数据增强,将上述两步骤产生的四个多区域增强的增强图像用作训练菜品分类神经网络,通过同时计算四个样本的平均距离损失以及分类损失来对神经网络进行协同优化;本发明通过对输入图像做多区域数据增强,使得神经网络对菜品的特征提取鲁棒性更强,降低模型对识别环境变化以及菜品形态变化的敏感程度,提升菜品识别模型在不同环境下的鲁棒性。

    一种基于自适应对比学习的菜品识别方法

    公开(公告)号:CN114758167A

    公开(公告)日:2022-07-15

    申请号:CN202210163470.4

    申请日:2022-02-22

    摘要: 本发明涉及一种基于自适应对比学习的菜品识别方法,与传统的菜品识别方法不同,基于自适应对比学习的神经网络,无需在线训练,对推理环境要求较低,本发明提出多尺度三元组损失函数,使得神经网络自适应的学习不同尺度差异的损失,从而更好的区分菜品间的细微差异;所述的多尺度三元组损失函数由包括三种边界的三元组损失函数以及一个最大值选择函数组成,可自适应选择三元组损失的边界值;本发明通过自适应对比学习的方式来实现菜品识别的离线推理,不仅不受菜品种类的约束,能够应对类别的实时变化,离线推理还大大降低了菜品识别应用环境的算力要求;本发明通过在反馈过程中引入低相似度样本自动删除,使得菜品识别方法可以长时间稳定运行。

    一种基于多区域数据增强的菜品识别方法

    公开(公告)号:CN114782735B

    公开(公告)日:2024-04-26

    申请号:CN202210163468.7

    申请日:2022-02-22

    摘要: 本发明一种基于多区域数据增强的菜品识别方法,在传统的菜品识别方法的基础上,对训练的过程中的每一张输入图像进行多区域数据增强;所述多区域增强方法分别由两步完成,第一步将输入图像从水平维度以及竖直维度平均裁剪为四等份,第二步选择每两个相邻的1/4等份分别做数据增强,将上述两步骤产生的四个多区域增强的增强图像用作训练菜品分类神经网络,通过同时计算四个样本的平均距离损失以及分类损失来对神经网络进行协同优化;本发明通过对输入图像做多区域数据增强,使得神经网络对菜品的特征提取鲁棒性更强,降低模型对识别环境变化以及菜品形态变化的敏感程度,提升菜品识别模型在不同环境下的鲁棒性。

    一种基于自适应对比学习的菜品识别方法

    公开(公告)号:CN114758167B

    公开(公告)日:2024-04-26

    申请号:CN202210163470.4

    申请日:2022-02-22

    摘要: 本发明涉及一种基于自适应对比学习的菜品识别方法,与传统的菜品识别方法不同,基于自适应对比学习的神经网络,无需在线训练,对推理环境要求较低,本发明提出多尺度三元组损失函数,使得神经网络自适应的学习不同尺度差异的损失,从而更好的区分菜品间的细微差异;所述的多尺度三元组损失函数由包括三种边界的三元组损失函数以及一个最大值选择函数组成,可自适应选择三元组损失的边界值;本发明通过自适应对比学习的方式来实现菜品识别的离线推理,不仅不受菜品种类的约束,能够应对类别的实时变化,离线推理还大大降低了菜品识别应用环境的算力要求;本发明通过在反馈过程中引入低相似度样本自动删除,使得菜品识别方法可以长时间稳定运行。

    车灯区域引导的高速公路场景低照度视频清晰化处理方法

    公开(公告)号:CN115147294A

    公开(公告)日:2022-10-04

    申请号:CN202210576297.0

    申请日:2022-05-24

    IPC分类号: G06T5/00 G06T5/50

    摘要: 本发明公开了一种车灯区域引导的高速公路场景下低照度视频清晰化处理方法,包括:提取低照度输入视频帧中的车灯位置,并将车灯前方区域的背景纹理信息进行累积,获得背景图像(S1);将输入视频帧和背景图像进行加权融合,获得背景信息融合图像(S2);提取融合图像中的直射光区域,并对融合图像进行掩膜后计算环境光照度(S3);根据环境光照度对融合图像的像素值进行亮度映射(S4)。相比传统低照度清晰化方法,本发明充分考虑了高速公路场景下车灯区域引入的额外信息和对环境光估计的影响,可有效提升低照度视频帧暗区纹理和抑制直射光炫光效应,亮度分布更加符合人眼视觉质量,可作为图像预处理插件应用到高速公路视频监控系统中。

    一种基于多流融合图卷积网络的行为识别方法

    公开(公告)号:CN114187653A

    公开(公告)日:2022-03-15

    申请号:CN202111356801.8

    申请日:2021-11-16

    摘要: 本发明属于行为识别技术领域,具体为一种基于多流融合图卷积网络的行为识别方法。本发明主要通过提取并融合多类行为信息进行行为识别,分为三个阶段进行:数据预处理、特征提取、特征融合。在数据预处理阶段,提出三种骨架规范化措施,减少人体位置、摄像机视角和人体与摄像机距离等因素对人体骨架数据表示的影响;在特征提取阶段,构建骨架的全局连接图,直接学习远距离关节点之间的相互关系;在特征融合阶段,分两阶段来融合三类信息的特征。本发明针所提出的方法更加有效的利用了多类行为的互补信息,提出的骨架规范化措施使得人体骨架的表示具有仿射不变性,降低了网络的训练难度,在公开数据集上取得了较好的结果。

    一种资源受限条件下民航飞机四舱异常检测方法

    公开(公告)号:CN118395827A

    公开(公告)日:2024-07-26

    申请号:CN202410204760.8

    申请日:2024-02-25

    摘要: 本发明设计了一种资源受限条件下民航飞机四舱异常检测方法。该方法将模型轻量化部署与模型选择结合,通过轻量化形成备选模型。提取模型输入数据的特征训练模型选择器,通过堆叠多个轻量化的模型,通过模型选择器选择当前输入数据、时延目标下的最佳模型,达到有效避免轻量化导致的精度下降的同时优化推理速度的效果;该方法以轻量级方式表征并行模型推理负载的性能变化,作为资源配置策略的基础。通过对计算资源的主动感知,联合输入数据特征,优化调整模型选择、GPU资源分配和批次大小设置,形成对计算资源自适应的模型动态部署优化策略,满足在嵌入式设备资源受限情况下的合理部署。

    一种面向民航飞机飞行全过程的视频清晰化处理方法

    公开(公告)号:CN118314046A

    公开(公告)日:2024-07-09

    申请号:CN202410443771.1

    申请日:2024-04-13

    IPC分类号: G06T5/73 G06T7/90 H04N23/95

    摘要: 本发明涉及一种面向民航飞机飞行全过程的视频清晰化处理方法及装置,包括:A)实时获取机上监控视频;B)计算视频画面亮度;C)针对逆光条件下光照的非均匀分布造成的视频明暗不均:采用非均匀光照环境下宽动态视频增强方法;D)针对低照度造成的获取视频不清晰:构建基于反射特性的暗光视频清晰成像方法,实现基于区域特性的视频噪声快速抑制。基于该方法,设计了一种面向民航飞机飞行全过程的视频清晰化处理装置,该装置包括四个模块:视频获取模块、亮度判别模块、非均匀光照视频清晰化处理模块和低照度视频清晰化处理模块,解决民航飞行过程中获取的视频不清晰、存在严重降质现象的问题,实现了民航飞行全过程四舱清晰视频获取。

    一种面向民航空地视频互联应用的带宽自适应多维码率控制方法

    公开(公告)号:CN118214901A

    公开(公告)日:2024-06-18

    申请号:CN202410084262.4

    申请日:2024-01-19

    摘要: 本发明设计了一种面向民航空地视频互联应用的带宽自适应多维码率控制方法,属于图像处理领域。该方法在空地互联场景下自动获取信道带宽并作为视频传输的目标码率,实现了民航空地视频的多维码率控制,构建了基于视频自身特性的自适应初始量化参数设定、基于缓冲区状态的帧层目标比特数分配、基于LCU层多维复杂度的目标码率分配以及参数动态更新模型,有效提高空地视频编码性能和节省输出码流。本发明可以应用于面向民航空地视频互联场景,在带宽不稳定且受限的情况下进行视频可靠传输,助力民航空地视频高质量通信。