面向AI实训的多模态数据集标注方法、装置及电子设备

发明公开

CN114708472A 面向AI实训的多模态数据集标注方法、装置及电子设备审中-实审

请登陆查看更多内容

专利标题： 面向AI实训的多模态数据集标注方法、装置及电子设备
申请号： CN202210629969.X

申请日： 2022-06-06
公开(公告)号： CN114708472A

公开(公告)日： 2022-07-05
发明人: 吴超 , 陈桂锟 , 肖俊 , 王朝 , 张志猛
申请人： 浙江大学
申请人地址： 浙江省杭州市西湖区余杭塘路866号
专利权人： 浙江大学
当前专利权人： 浙江大学
当前专利权人地址： 浙江省杭州市西湖区余杭塘路866号
代理机构： 杭州求是专利事务所有限公司
代理商 傅朝栋; 张法高
主分类号： G06V10/774
IPC分类号： G06V10/774 ; G06V10/778 ; G06V10/80 ; G06V10/764 ; G06V10/766 ; G06V10/82 ; G06V20/70 ; G06F40/279 ; G06F40/242 ; G06N3/04 ; G06N3/08 ; G06K9/62

摘要：

本发明公开了一种面向AI实训的多模态数据集标注方法、装置及电子设备，属于计算机视觉领域。本发明通过基于深度学习技术和图对齐融合的场景图生成算法，利用图像描述的弱监督信息产生第一类场景图，进一步与基于图像生成的第二类场景图进行对齐和融合，最终产生候选的初始场景图作为人工标注的参考，避免了错误标注和漏标注。本发明可为多模态数据集的人工标注提供智能标注提示，使得人工标注时仅需优化侯选的场景图即可，大大降低了标注规模和标注难度，可有效提高多模态数据的标注效率。

公开/授权文献

CN114708472B 面向AI实训的多模态数据集标注方法、装置及电子设备公开/授权日：2022-09-09

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V10/00	图像或视频识别或理解的安排（图像或视频中的字符识别 G06V30/10）
G06V10/70	.使用模式识别或机器学习（光学模式识别或电子计算 G06V10/88）
G06V10/77	..处理特征空间中的图像或视频特征；使用数据集成或数据缩减，例如主成分分析 [PCA] 或独立成分分析 [ICA] 或自组织图 [SOM]；盲源分离
G06V10/774	...生成训练模式集；引导方法，例如捕获或促进