-
公开(公告)号:CN117576784B
公开(公告)日:2024-03-26
申请号:CN202410049996.9
申请日:2024-01-15
Applicant: 吉林大学
IPC: G06V40/20 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 一种融合事件和RGB数据潜水员手势识别方法及其系统,涉及水下计算机视觉的技术领域。解决现有潜水员手势识别方法单独依赖视觉信息会存在局限性,如准确性低和鲁棒性差的问题。采用事件相机采集多样化的潜水员手势视频,转化成事件序列和RGB帧,并构建基准数据集;将事件序列数据映射到三维网格,采用多维特征表示;采用滑动窗口处理所述RGB帧,针对每个窗口内进行局部处理获得RGB特征;采用MLP编码事件和RGB特征,得到多模态融合的信息表达;采用预训练的ResNet3D18和EGRU单元构成手势识别模型对融合后的特征进行训练,最终输出潜水员手势的准确类别。本发明适用于潜水员工作时的信息交互和信息传递。
-
公开(公告)号:CN117746227A
公开(公告)日:2024-03-22
申请号:CN202410182760.2
申请日:2024-02-19
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/147 , G06V10/44 , G06V10/764 , G06V10/82
Abstract: 本发明属于水下机器视觉技术领域,本发明公开了一种红外偏振成像数据的水下目标细粒度分类方法,包括以下步骤:基于偏振相机获取图像构建水下基准数据集;利用交叠的滑动窗口对所述水下基准数据集中的所述红外偏振图像进行划分并编码,得到编码结果,并输入预训练视觉变换器编码器的共L层变换器层中,得到多层级的视觉特征和多层级的注意力图;利用前L‑1层每一层级的所述注意力图对自注意动态加权得到多层级动态注意力权重,并进行特征选择,得到特征组1;利用前L‑1层每一层级的注意力图对每一层级的特征进行前k个选择,得到多层级优化特征组2;将特征组1和特征组2输入第L层变换器层中,利用类别序列通过全连接层计算最终的类别。
-
公开(公告)号:CN117671472A
公开(公告)日:2024-03-08
申请号:CN202410128788.8
申请日:2024-01-31
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/0464 , G06N3/08 , G06V10/36 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 一种基于动态视觉传感器的水下多目标群体识别方法。所述方法包括如下步骤:S1、利用动态视觉传感器收集水下多目标群体RGB图像与水下多目标群体事件;S2、使用水下多目标群体事件图像与水下多目标群体RGB图像构建数据集,按照比例划分训练集与验证集;S3、所述多目标群体识别模型以目标检测模型为基础,在目标检测模型骨干网络前嵌入自适应图像增强模块,在目标检测模型骨干网络和颈部网络之间嵌入特征级模态融合模块;S4、将训练集的数据输入步骤S4所述的多目标群体识别模型进行训练,以此获得符合要求的模型参数,并通过验证集验证效果;S5、通过训练好的多目标群体识别模型进行水下多目标群体识别。
-
公开(公告)号:CN117576784A
公开(公告)日:2024-02-20
申请号:CN202410049996.9
申请日:2024-01-15
Applicant: 吉林大学
IPC: G06V40/20 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 一种融合事件和RGB数据潜水员手势识别方法及其系统,涉及水下计算机视觉的技术领域。解决现有潜水员手势识别方法单独依赖视觉信息会存在局限性,如准确性低和鲁棒性差的问题。采用事件相机采集多样化的潜水员手势视频,转化成事件序列和RGB帧,并构建基准数据集;将事件序列数据映射到三维网格,采用多维特征表示;采用滑动窗口处理所述RGB帧,针对每个窗口内进行局部处理获得RGB特征;采用MLP编码事件和RGB特征,得到多模态融合的信息表达;采用预训练的ResNet3D18和EGRU单元构成手势识别模型对融合后的特征进行训练,最终输出潜水员手势的准确类别。本发明适用于潜水员工作时的信息交互和信息传递。
-
公开(公告)号:CN116912675B
公开(公告)日:2023-11-28
申请号:CN202311175150.1
申请日:2023-09-13
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/096 , G06V10/80 , G06V10/82
Abstract: 一种基于特征迁移的水下目标检测方法及系统,涉及水下机器视觉目标检测技术领域。解决现有水下目标检测方法存在的水下图像质量差、识别误差大和泛化能力差的问题。方法为:构建基准数据集进而训练迁移对抗学习网络模型,采用训练后的迁移对抗学习网络模型将水下高清图像的特征迁移到水下模糊目标图像上;将两层坐标注意力增强模块添加到YOLOv5的骨干网络中,并添加一组锚框和SIOU位置损失函数,获得DCA‑YOLOv5目标检测模型;采用DCA‑YOLOv5目标检测模型对特征增强后的水下高清目标图像进行目标检测,获得目标的位置和类别信息。本发明适用于水下模糊场景增强以及高精度的水下目标检测。
-
公开(公告)号:CN116682000B
公开(公告)日:2023-10-13
申请号:CN202310936412.5
申请日:2023-07-28
Applicant: 吉林大学
IPC: G06V20/05 , G06N3/0464 , G06N3/08 , G06V10/80 , G06V10/82
Abstract: 一种基于事件相机的水下蛙人目标检测方法。属于水下机器视觉目标检测技术领域,具体涉及水下蛙人目标检测领域。其解决了以往的水下蛙人目标检测缺乏鲁棒性强的特征信息的问题。所述方法具体为:利用事件相机获取水下蛙人事件序列和RGB图像,设计RGB残差学习模块,用于充分提取水下蛙人RGB图像空间特征信息,设计事件残差学习模块,用于充分提取水下蛙人事件图像纹理特征信息,设计特征融合网络,使水下蛙人RGB图像特征信息与水下蛙人事件图像特征信息进行细粒度特征融合。本发明所述方法可以应用在水下目标检测技术领域、水下航行安全检测领域以及水下目标识别设备制造领域。
-
公开(公告)号:CN116295449B
公开(公告)日:2023-09-12
申请号:CN202310593764.5
申请日:2023-05-25
Applicant: 吉林大学
Abstract: 水下自主航行器路径指示方法及装置,涉及运动方向指示技术领域。为解决现有技术中存在的,水下自主航行器无法应对复杂的海洋环境的技术问题,本发明提供的技术方案为:水下自主航行器路径指示方法,包括:采集海洋环境对航行器的影响因素的步骤;采集航行器的可行动动作的步骤;建立奖励函数的步骤;根据奖励函数,建立强化网络的建模步骤;采集航行器的高不确定性动作策略和对应的航行器状态,得到经验元组集合的收集步骤;随机抽取集合中的经验元组对强化网络进行训练的训练步骤;重复收集步骤和训练步骤,至达到预设次数的步骤;根据训练后的强化网络确定航行器的最佳路径的步骤。适合应用于未知水下空间内的最优路径规划工作中。
-
公开(公告)号:CN116309781B
公开(公告)日:2023-08-22
申请号:CN202310557817.8
申请日:2023-05-18
Applicant: 吉林大学
Abstract: 本申请公开了一种基于跨模态融合的水下视觉目标测距方法及装置,属于水下机器视觉技术领域,包括:获取水下的事件序列和RGB帧;通过体素网格方式对事件序列进行分段表征;对事件序列和RGB帧进行特征编码得到相应的特征描述子;通过自注意力机制对事件序列和RGB帧进行空间关系提取,得到用于描述局部事件与时空全局事件之间关系的依赖关系;根据特征描述子和依赖关系对事件序列和RGB帧进行特征融合,得到跨模态融合信息;根据跨模态融合信息进行预测并得到水下视觉目标距离。通过将事件和RGB两种数据模态跨模态融合,有效提升水下视觉目标距离估计的准确率。适用于为水下三维重建、目标检测、识别追踪等任务提供新的数据表达。
-
公开(公告)号:CN116561649A
公开(公告)日:2023-08-08
申请号:CN202310832974.5
申请日:2023-07-10
Applicant: 吉林大学
IPC: G06F18/24 , G06N3/048 , G06F16/22 , G06F18/10 , G06F18/15 , G06F18/213 , G06F18/25 , A61B5/11 , G01C21/16
Abstract: 基于多源传感器数据的潜水员运动状态识别方法和系统,解决了基于视觉方法在低光场景下的人体识别效果差的问题。涉及水下潜水员运动状态识别领域。方法包括:通过惯性传感器采集潜水员的水下活动的数据,并将数据存储在数据库中;对数据进行分割组成事件序列,并嵌入活动级上下文信息;建立词典,将事件序列中的每一个传感器事件转化为词索引,并建立嵌入矩阵;基于Transformer的GIF特征提取模块提取嵌入矩阵的特征,获得特征向量;利用一维平均池化层和带Softmax激活函数的全连接层对特征向量进行处理,获取识别模型,输出每个类别的预测概率,最终得到潜水员的姿态识别结果。本发明应用于水下目标识别领域。
-
公开(公告)号:CN116309781A
公开(公告)日:2023-06-23
申请号:CN202310557817.8
申请日:2023-05-18
Applicant: 吉林大学
Abstract: 本申请公开了一种基于跨模态融合的水下视觉目标测距方法及装置,属于水下机器视觉技术领域,包括:获取水下的事件序列和RGB帧;通过体素网格方式对事件序列进行分段表征;对事件序列和RGB帧进行特征编码得到相应的特征描述子;通过自注意力机制对事件序列和RGB帧进行空间关系提取,得到用于描述局部事件与时空全局事件之间关系的依赖关系;根据特征描述子和依赖关系对事件序列和RGB帧进行特征融合,得到跨模态融合信息;根据跨模态融合信息进行预测并得到水下视觉目标距离。通过将事件和RGB两种数据模态跨模态融合,有效提升水下视觉目标距离估计的准确率。适用于为水下三维重建、目标检测、识别追踪等任务提供新的数据表达。
-
-
-
-
-
-
-
-
-