-
公开(公告)号:CN116416586B
公开(公告)日:2024-04-02
申请号:CN202211632013.1
申请日:2022-12-19
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06V20/56 , G06V10/26 , G06V10/764
摘要: 本发明公开了基于RGB点云的地图元素感知方法、终端及存储介质,方法包括:对RGB点云进行体素化处理,得到体素化RGB点云;将所述体素化RGB点云输入地图元素感知模型进行语义标注,得到各地图元素的语义标注信息;其中,所述地图元素感知模型为具有多种不同扩张倍率感受野的模型;输出所述RGB点云中各地图元素的语义标注信息。本发明提出扩张注意力模块进行更有效的卷积计算,构建更为复杂的多尺度空间感知模块,用于地图元素的语义标注,解决稀疏性BEV中的地图元素感知问题,提高感知精度。
-
公开(公告)号:CN117372444A
公开(公告)日:2024-01-09
申请号:CN202311389484.9
申请日:2023-10-24
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06T7/10 , G06V10/26 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于轻量化适配器微调的交互式图像分割方法及系统,所述方法包括:获取输入图像和点击图像,并对输入图像进行图像分割,得到若干不重叠的图像块;将点击图像和图像块输入Plain ViT骨干网络进行图像特征融合,得到输入图像的多尺度特征图;将输入图像输入自适应域特征提取器进行图像特征提取,得到输入图像的高质量特征图;获取历史预测图像和掩码特征,对历史预测图像进行下采样,得到历史预测图像缩略图;将历史预测图像缩略图、掩码特征、多尺度特征图和高质量特征图输入ViT骨干网络适配器进行图像解码,得到预测图像。本申请将自适应域特征提取网络与骨干网络结合提取图像特征,获得更好的图像分割效果和效率。
-
公开(公告)号:CN117422728A
公开(公告)日:2024-01-19
申请号:CN202311387492.X
申请日:2023-10-24
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本发明公开了一种基于多尺度特征交互的交互式图像分割方法及终端,方法包括:根据图像块大小的不同,获取多个尺寸特征;将所述尺寸特征与基本尺寸特征融合;并对所述基本尺寸特征进行微调;通过三元损失函数学习鲁棒的多尺度特征选择,得到交互式图像分割模型。本发明通过多尺度的图像特征,提出了基于多尺度特征交互的交互式图像分割方法,解决了现有的交互式图像分割方法存在难以处理复杂目标尺度变化的问题。
-
公开(公告)号:CN116824138A
公开(公告)日:2023-09-29
申请号:CN202310693770.8
申请日:2023-06-12
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本申请实施例公开了基于点击点影响增强的交互式图像分割方法及设备,用于提高增强点击点影响范围,并提升图像分割精度。本申请实施例方法包括:将第N轮的预测掩码图确定为第N+1轮的初始掩码图,并根据前N+1轮的点击操作生成第N+1轮的点击图;将第N轮获得的预测掩码图对应的原始图像、第N+1轮的点击图以及第N+1轮的初始掩码图,输入预先训练好的目标图像分割模型,获得第N+1轮的预测掩码图,目标图像分割模型包括目标点击点增强层,用于增强第N+1轮的点击图中目标点击点的影响范围,目标点击点包括第N+1轮的点击图中,与第N+1轮的点击操作对应的点击点;响应于针对第N+1轮的预测掩码图的分割确认指令,基于第N+1轮的预测掩码图对原始图像执行图像分割操作。
-
公开(公告)号:CN116416586A
公开(公告)日:2023-07-11
申请号:CN202211632013.1
申请日:2022-12-19
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06V20/56 , G06V10/26 , G06V10/764
摘要: 本发明公开了基于RGB点云的地图元素感知方法、终端及存储介质,方法包括:对RGB点云进行体素化处理,得到体素化RGB点云;将所述体素化RGB点云输入地图元素感知模型进行语义标注,得到各地图元素的语义标注信息;其中,所述地图元素感知模型为具有多种不同扩张倍率感受野的模型;输出所述RGB点云中各地图元素的语义标注信息。本发明提出扩张注意力模块进行更有效的卷积计算,构建更为复杂的多尺度空间感知模块,用于地图元素的语义标注,解决稀疏性BEV中的地图元素感知问题,提高感知精度。
-
-
-
-