面向AI实训的多模态数据集标注方法、装置及电子设备
摘要:
本发明公开了一种面向AI实训的多模态数据集标注方法、装置及电子设备,属于计算机视觉领域。本发明通过基于深度学习技术和图对齐融合的场景图生成算法,利用图像描述的弱监督信息产生第一类场景图,进一步与基于图像生成的第二类场景图进行对齐和融合,最终产生候选的初始场景图作为人工标注的参考,避免了错误标注和漏标注。本发明可为多模态数据集的人工标注提供智能标注提示,使得人工标注时仅需优化侯选的场景图即可,大大降低了标注规模和标注难度,可有效提高多模态数据的标注效率。
0/0