-
公开(公告)号:CN115859664A
公开(公告)日:2023-03-28
申请号:CN202211633834.7
申请日:2022-12-19
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06F30/20 , G06F30/10 , G06T17/00 , G06F111/04
摘要: 本申请实施例公开了针对密集堆叠物体的数据集构建方法以及相关设备,用于减少数据集构建过程的人工操作、提升数据集构建效率以及增强数据集可靠性。本申请实施例方法包括:获取初始数据集,所述初始数据集包括多个初始样本,每个初始样本均包括密集堆叠的多个物体;轮流将所述初始数据集中的每个初始样本确定为待处理样本;从预先构建的纹理数据库中获取至少一个真实纹理;使用所述真实纹理替换所述待处理样本中每个物体的初始表面纹理,得到目标样本;确定包括每个所述目标样本的目标数据集。
-
公开(公告)号:CN115690787A
公开(公告)日:2023-02-03
申请号:CN202211390885.1
申请日:2022-11-07
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本申请实施例公开了一种语义分割方法、图像处理设备以及计算机可读存储介质,用于在提高分割精确度的情况下,对原始图像进行语义分割。本申请实施例方法包括:获得原始图像后,将原始图像输入语义分割模型的多尺度特征提取模块,得到多尺度特征提取模块输出的原始图像的N级尺度的第一特征图;N大于或等于2的整数;语义分割模型为预先训练的模型,分别将N级尺度的第一特征图输入语义分割模型的目标融合模块,由目标融合模块对N级尺度的第一特征图进行至少一次融合处理后,得到目标融合模块输出的N级尺度的目标融合特征图,根据N级尺度的目标融合特征图生成原始图像对应的语义分割图像。
-
公开(公告)号:CN112634246B
公开(公告)日:2023-09-12
申请号:CN202011586672.7
申请日:2020-12-28
申请人: 深圳市人工智能与机器人研究院 , 香港中文大学(深圳)
IPC分类号: G06T7/00 , G06T7/11 , G06V10/25 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请实施例公开了一种口腔图像识别方法,包括:使用神经网络模型对口腔图像进行识别,以获得口腔图像的识别结果,类别包括口腔及口腔内器官组织;判断口腔内器官组织对应的图像区域与口腔对应的图像区域之间的关系是否符合预设位置关系规则,得到判断结果;基于所述判断结果调整所述多个类别对应的置信度;基于所述多个类别对应的置信度输出所述识别结果。通过上述方式对使用神经网络模型识别获得的识别结果进行了进一步的识别,通过其位置关系相应调整置信度,避免某些不符合相应位置关系的错误结果被输出,提高了口腔图像识别所获得的结果的准确度,提供了一种适用于对口腔图像进行识别的新方法。
-
公开(公告)号:CN117422728A
公开(公告)日:2024-01-19
申请号:CN202311387492.X
申请日:2023-10-24
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本发明公开了一种基于多尺度特征交互的交互式图像分割方法及终端,方法包括:根据图像块大小的不同,获取多个尺寸特征;将所述尺寸特征与基本尺寸特征融合;并对所述基本尺寸特征进行微调;通过三元损失函数学习鲁棒的多尺度特征选择,得到交互式图像分割模型。本发明通过多尺度的图像特征,提出了基于多尺度特征交互的交互式图像分割方法,解决了现有的交互式图像分割方法存在难以处理复杂目标尺度变化的问题。
-
公开(公告)号:CN116824138A
公开(公告)日:2023-09-29
申请号:CN202310693770.8
申请日:2023-06-12
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本申请实施例公开了基于点击点影响增强的交互式图像分割方法及设备,用于提高增强点击点影响范围,并提升图像分割精度。本申请实施例方法包括:将第N轮的预测掩码图确定为第N+1轮的初始掩码图,并根据前N+1轮的点击操作生成第N+1轮的点击图;将第N轮获得的预测掩码图对应的原始图像、第N+1轮的点击图以及第N+1轮的初始掩码图,输入预先训练好的目标图像分割模型,获得第N+1轮的预测掩码图,目标图像分割模型包括目标点击点增强层,用于增强第N+1轮的点击图中目标点击点的影响范围,目标点击点包括第N+1轮的点击图中,与第N+1轮的点击操作对应的点击点;响应于针对第N+1轮的预测掩码图的分割确认指令,基于第N+1轮的预测掩码图对原始图像执行图像分割操作。
-
公开(公告)号:CN116416586A
公开(公告)日:2023-07-11
申请号:CN202211632013.1
申请日:2022-12-19
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06V20/56 , G06V10/26 , G06V10/764
摘要: 本发明公开了基于RGB点云的地图元素感知方法、终端及存储介质,方法包括:对RGB点云进行体素化处理,得到体素化RGB点云;将所述体素化RGB点云输入地图元素感知模型进行语义标注,得到各地图元素的语义标注信息;其中,所述地图元素感知模型为具有多种不同扩张倍率感受野的模型;输出所述RGB点云中各地图元素的语义标注信息。本发明提出扩张注意力模块进行更有效的卷积计算,构建更为复杂的多尺度空间感知模块,用于地图元素的语义标注,解决稀疏性BEV中的地图元素感知问题,提高感知精度。
-
公开(公告)号:CN112634246A
公开(公告)日:2021-04-09
申请号:CN202011586672.7
申请日:2020-12-28
申请人: 深圳市人工智能与机器人研究院 , 香港中文大学(深圳)
摘要: 本申请实施例公开了一种口腔图像识别方法,包括:使用神经网络模型对口腔图像进行识别,以获得口腔图像的识别结果,类别包括口腔及口腔内器官组织;判断口腔内器官组织对应的图像区域与口腔对应的图像区域之间的关系是否符合预设位置关系规则,得到判断结果;基于所述判断结果调整所述多个类别对应的置信度;基于所述多个类别对应的置信度输出所述识别结果。通过上述方式对使用神经网络模型识别获得的识别结果进行了进一步的识别,通过其位置关系相应调整置信度,避免某些不符合相应位置关系的错误结果被输出,提高了口腔图像识别所获得的结果的准确度,提供了一种适用于对口腔图像进行识别的新方法。
-
公开(公告)号:CN116416586B
公开(公告)日:2024-04-02
申请号:CN202211632013.1
申请日:2022-12-19
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06V20/56 , G06V10/26 , G06V10/764
摘要: 本发明公开了基于RGB点云的地图元素感知方法、终端及存储介质,方法包括:对RGB点云进行体素化处理,得到体素化RGB点云;将所述体素化RGB点云输入地图元素感知模型进行语义标注,得到各地图元素的语义标注信息;其中,所述地图元素感知模型为具有多种不同扩张倍率感受野的模型;输出所述RGB点云中各地图元素的语义标注信息。本发明提出扩张注意力模块进行更有效的卷积计算,构建更为复杂的多尺度空间感知模块,用于地图元素的语义标注,解决稀疏性BEV中的地图元素感知问题,提高感知精度。
-
公开(公告)号:CN117372444A
公开(公告)日:2024-01-09
申请号:CN202311389484.9
申请日:2023-10-24
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
IPC分类号: G06T7/10 , G06V10/26 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于轻量化适配器微调的交互式图像分割方法及系统,所述方法包括:获取输入图像和点击图像,并对输入图像进行图像分割,得到若干不重叠的图像块;将点击图像和图像块输入Plain ViT骨干网络进行图像特征融合,得到输入图像的多尺度特征图;将输入图像输入自适应域特征提取器进行图像特征提取,得到输入图像的高质量特征图;获取历史预测图像和掩码特征,对历史预测图像进行下采样,得到历史预测图像缩略图;将历史预测图像缩略图、掩码特征、多尺度特征图和高质量特征图输入ViT骨干网络适配器进行图像解码,得到预测图像。本申请将自适应域特征提取网络与骨干网络结合提取图像特征,获得更好的图像分割效果和效率。
-
公开(公告)号:CN115631489A
公开(公告)日:2023-01-20
申请号:CN202211371118.6
申请日:2022-11-03
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本申请公开了一种三维语义场景补全方法、装置、设备及介质,涉及三维场景补全领域,该方法包括:利用目标RGB‑D图像中的二维图像对应的深度估计图像对目标RGB‑D图像中的深度图像进行深度补全,并利用预设特征提取器提取补全后深度图像中的二维目标特征;将二维目标特征和对二维图像进行语义分割获取的二维语义特征输入预设投影层,获取预设投影层输出的三维目标特征和三维语义特征;将三维目标特征和三维语义特征输入3D主干网络,获取3D主干网络输出的提取后特征;将提取后特征、三维目标特征以及三维语义特征进行特征融合,并利用融合后特征完成三维语义场景补全。本发明挖掘补全深度先验,并实现与语义先验的融合,完成三维语义场景补全。
-
-
-
-
-
-
-
-
-