发明公开
- 专利标题: 一种从人类演示中提取操作技能信息并构建知识库的方法
-
申请号: CN202410286557.X申请日: 2024-03-13
-
公开(公告)号: CN118070890A公开(公告)日: 2024-05-24
- 发明人: 熊蓉 , 陈颖澔 , 张浩东 , 周忠祥
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州中成专利事务所有限公司
- 代理商 李亦慈; 唐银益
- 主分类号: G06N5/022
- IPC分类号: G06N5/022 ; G06N5/04 ; G06N3/008 ; G06V20/40 ; G06V40/20 ; G06V20/70 ; G06T7/70
摘要:
本发明公开了一种从人类演示中提取操作技能信息并构建知识库的方法,包括获取人类演示RGB视频,通过动作分割模块得到人类演示中的操作技能序列以及每个操作技能在演示视频中的起止帧,对每个操作技能在演示视频中的起止帧进行物体相对位置关系识别,获取物体相对位置关系等步骤,本发明将演示学习与人类指令相结合,利用大语言模型的解析能力,实现了从人类指令到机器人操作技能序列的生成。这种方法突破了以往演示学习主要依赖视觉信息的局限,将文本指令、语音指令等多元输入与视觉演示同步整合,以丰富机器人理解任务和环境的能力。