基于视觉语言大模型的机器人操纵方法

发明公开

请登陆查看更多内容

专利标题： 基于视觉语言大模型的机器人操纵方法
申请号： CN202410784930.4

申请日： 2024-06-18
公开(公告)号： CN118559711A

公开(公告)日： 2024-08-30
发明人: 高亚斌 , 尚瀚军 , 陈艺翔 , 匡冀源 , 齐弼卿 , 刘健行 , 孙光辉 , 吴立刚
申请人： 哈尔滨工业大学
申请人地址： 黑龙江省哈尔滨市南岗区西大直街92号
专利权人： 哈尔滨工业大学
当前专利权人： 哈尔滨工业大学
当前专利权人地址： 黑龙江省哈尔滨市南岗区西大直街92号
代理机构： 哈尔滨市松花江联合专利商标代理有限公司
代理商 杨晓辉
主分类号： B25J9/16
IPC分类号： B25J9/16

摘要：

基于视觉语言大模型的机器人操纵方法，本发明涉及人工智能和具身智能领域，具体涉及基于视觉语言大模型的机器人操纵方法。本发明的目的是为了解决现有机器人理解指令及视觉环境后执行的操纵任务完成准确率低的问题。过程为：将语言指令文本和深度相机捕获的RGBD图像输入视觉语言大模型；视觉语言大模型的PC机输出三维位置坐标、三维旋转位姿和机械爪的开闭状态；视觉语言大模型机械臂上Jetson Nano端通过ROS接收三维位置坐标、三维旋转位姿和机械爪的开闭状态；对接收到的三维位置坐标、三维旋转位姿和机械爪的开闭状态信息进行逆运动学解算，将解算后的各关节角度输入舵机，对舵机进行PID控制完成机械臂的动作。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

B	作业；运输
B25	手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J	机械手；装有操纵装置的容器（单独采摘水果、蔬菜、啤酒花或类似作物的自动装置入A01D46/30；外科用的针头操纵器入A61B17/062；与滚轧机有关的机械手入B21B39/20；与锻压机有关的机械手入B21J13/10；夹持轮子或其部件的装置入B60B30/00；起重机入B66C；用于核反应堆中所用的燃料或其他材料的处理设备入G21C19/00；机械手与加有防辐射的小室或房间的组合结构入G21F7/06）
B25J9/00	程序控制机械手
B25J9/16	.程序控制（全面生产控制，即集中控制多台机器入G05B19/418）