一种基于平行重组网络的机械臂多任务强化学习方法

    公开(公告)号:CN118014054B

    公开(公告)日:2024-06-21

    申请号:CN202410415056.7

    申请日:2024-04-08

    IPC分类号: G06N3/092 G06N3/048

    摘要: 本发明提供了一种基于平行重组网络的机械臂多任务强化学习方法,属于机械臂运动控制技术领域,该方法包括构建基于平行重组网络的机械臂多任务强化学习模型PR‑SAC,并进行训练;利用已训练的机械臂多任务强化学习模型PR‑SAC对机械臂进行控制,以实现通过单一网络对机械臂进行多任务控制。本发明通过重新组合网络层中层与层之间的关系,使得网络层中信息共享的更为充分,然后通过权重网络,自动选择每个任务的最佳路径,输出每个模块被选择的概率。因此,这种结构可以尽可能地获得多任务关系带来的好处。此外,在学习方法中加入了样本修正的模块,以避免当前策略与样本不符合造成策略更新出现问题。

    一种基于平行重组网络的机械臂多任务强化学习方法

    公开(公告)号:CN118014054A

    公开(公告)日:2024-05-10

    申请号:CN202410415056.7

    申请日:2024-04-08

    IPC分类号: G06N3/092 G06N3/048

    摘要: 本发明提供了一种基于平行重组网络的机械臂多任务强化学习方法,属于机械臂运动控制技术领域,该方法包括构建基于平行重组网络的机械臂多任务强化学习模型PR‑SAC,并进行训练;利用已训练的机械臂多任务强化学习模型PR‑SAC对机械臂进行控制,以实现通过单一网络对机械臂进行多任务控制。本发明通过重新组合网络层中层与层之间的关系,使得网络层中信息共享的更为充分,然后通过权重网络,自动选择每个任务的最佳路径,输出每个模块被选择的概率。因此,这种结构可以尽可能地获得多任务关系带来的好处。此外,在学习方法中加入了样本修正的模块,以避免当前策略与样本不符合造成策略更新出现问题。

    一种便携式履带底盘
    7.
    实用新型

    公开(公告)号:CN217623823U

    公开(公告)日:2022-10-21

    申请号:CN202221274561.7

    申请日:2022-05-24

    摘要: 本实用新型公开了一种便携式履带底盘,属于底盘结构技术领域。一种便携式履带底盘,包括:间隔设置的前车架和后车架,分别设置在前车架和后车架两侧的侧挡板,以及与侧挡板连接的履带行走组件;前车架上设有与履带行走组件通信连接的供电池;侧挡板上连接有转接件,转接件的顶面设有把手,把手位于前车架和后车架之间的位置。本实用新型通过前车架上的供电池向履带行走组件提供动力源,使得履带行走组件带动整体底盘进行行走。对前车架、后车架以及侧挡板的结构进行简化,降低质量的同时保留其越障性能,并且在二者之间通过转接件连接有把手,使得工作人员可以通过把手带动整体履带底盘进行便携移动。

    一种轻型多自由度机械臂

    公开(公告)号:CN217620579U

    公开(公告)日:2022-10-21

    申请号:CN202221274503.4

    申请日:2022-05-24

    IPC分类号: B25J9/00 B25J19/02

    摘要: 本实用新型公开了一种轻型多自由度机械臂,属于机械自动化技术领域。一种轻型多自由度机械臂,包括:基座、第一力臂、第二力臂、连接在夹持组件以及用于带动各部件进行动作的控制组件;夹持组件包括:与第二力臂端部连接的夹盘、一端与夹盘端面铰接的连杆组以及连接在连杆组另一端的夹指,连杆组和夹指的数量为两组,夹盘的内部设有分别带动连杆组转动的夹持驱动件。本实用新型的基座起到整体支撑的作用,控制组件用于带动各部件有序进行动作,第一力臂和第二力臂起到连接以及转动的作用,用于带动夹持组件进行角度和位置调节,两个夹指在连杆组的作用下相对夹盘进行动作,使得夹指相互靠近或者远离,从而完成对物件的夹持和放松。

    一种排爆机器人
    9.
    实用新型

    公开(公告)号:CN217620613U

    公开(公告)日:2022-10-21

    申请号:CN202221264753.X

    申请日:2022-05-24

    摘要: 本实用新型公开了一种排爆机器人,属于机器人应用技术领域。一种排爆机器人,包括:行走车体、驱动组件和排爆组件;排爆组件包括:支撑座、第一力臂、第二力臂以及夹持机构,夹持机构包括:夹盘、连杆组以及夹指,夹指和连杆组的数量分别为至少两组。本实用新型的行走车体用于带动驱动组件和排爆组件进行行走移动,驱动组件用于向行走车体以及排爆组件提供进行动作的动力源;排爆组件由支撑座进行支撑,第一力臂和第二力臂带动夹持机构靠近需要进行作业的危险物,再由连杆组带动夹指移动,从而进行排爆作业,解决现有反恐排爆过程中容易对士兵生命造成危害的问题。