一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985B

    公开(公告)日:2024-05-24

    申请号:CN202410171178.6

    申请日:2024-02-06

    申请人: 之江实验室

    IPC分类号: G06N3/092 G06F30/27

    摘要: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

    分布式任务处理系统及方法、装置、存储介质以及设备

    公开(公告)号:CN116737345A

    公开(公告)日:2023-09-12

    申请号:CN202311010091.2

    申请日:2023-08-11

    申请人: 之江实验室

    IPC分类号: G06F9/48

    摘要: 本说明书公开了一种分布式任务处理系统及方法、装置、存储介质以及设备,在对各任务进行处理的过程中,通过调度节点确定各任务的任务信息,并基于各任务信息,确定系统的负载情况,以及在负载情况过高时,确定需要终止的目标任务,将该目标任务的任务标识广播给计算节点。计算节点可根据接收到的目标任务的任务标识,判断自身是否在执行该目标任务,若是,则将该目标任务的状态更新为终止状态,并停止执行该目标任务。本说明书可对分布式处理系统的负载状态进行监控,并在监控到系统负载过高时,自动基于各任务的任务信息,确定需终止的目标任务来进行终止。在不需要增加计算资源的情况下,也可保证该系统的任务处理效率。

    一种基于应急疏散的信息推送方法、装置以及电子设备

    公开(公告)号:CN118761634A

    公开(公告)日:2024-10-11

    申请号:CN202411243824.1

    申请日:2024-09-05

    申请人: 之江实验室

    摘要: 本说明书公开了一种基于应急疏散的信息推送方法、装置以及电子设备,具体包括:根据获取到的目标区域对应的地理信息数据和建筑图,构建模拟目标区域,并对模拟目标区域进行单元格划分。同时根据各人员的个人特征数据,构建各人员的个人仿真对象,确定每个人员的个人仿真对象在模拟目标区域中占据的单元格区域。基于模拟目标区域、各个人仿真对象以及各个人仿真对象对应的单元格区域,根据预设的规则,针对目标建筑物进行人员疏散的仿真测试。根据仿真测试结果,进行信息推送。通过此方法可以充分考虑到室内外因素对于整个疏散过程以及互相之间的影响,从而制定出实用性较高的应急疏散策略,有效保障了人民群众在遇到突发险情时的生命安全。

    一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985A

    公开(公告)日:2024-03-19

    申请号:CN202410171178.6

    申请日:2024-02-06

    申请人: 之江实验室

    IPC分类号: G06N3/092 G06F30/27

    摘要: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

    带数据集上传展示图形用户界面的显示屏幕面板

    公开(公告)号:CN308451522S

    公开(公告)日:2024-02-02

    申请号:CN202330429833.X

    申请日:2023-07-10

    申请人: 之江实验室

    摘要: 1.本外观设计产品的名称:带数据集上传展示图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于显示界面。
    3.本外观设计产品的设计要点:在于产品屏幕中的图形用户界面内容。
    4.最能表明设计要点的图片或照片:设计1主视图。
    5.指定设计1为基本设计。
    6.图形用户界面的用途:界面用于电脑、平板。本设计的图形用户界面用于展示数据集
    上传。
    7.图形用户界面的变化状态说明:设计1‑设计8主视图为数据集上传展示界面。界面左
    侧显示有模型管理栏。模型管理栏包括数据集;界面的右侧显示有模型配置信息栏,界面的
    上方显示有工具栏。界面的中部可用于展示具体的内容画面的画面展示区域。通过点击界
    面左侧模型管理栏的数据集的任意位置,均可进行界面的跳转。在设计1、设计2、设计3、设
    计4、设计5、设计6、设计7和设计8中,显示数据集上传对话框时的背景界面以及数据集上传
    对话框。通过点击数据集上传对话框中的任意位置,均可进行界面的跳转。
    4

    带数据管理展示图形用户界面的显示屏幕面板

    公开(公告)号:CN308464861S

    公开(公告)日:2024-02-09

    申请号:CN202330429840.X

    申请日:2023-07-10

    申请人: 之江实验室

    摘要: 1.本外观设计产品的名称:带数据管理展示图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于显示界面。
    3.本外观设计产品的设计要点:在于产品屏幕中的图形用户界面内容。
    4.最能表明设计要点的图片或照片:设计4主视图。
    5.指定设计4为基本设计。
    6.图形用户界面的用途:显示屏幕面板用于电脑、平板。本设计的图形用户界面用于展
    示数据管理。
    7.图形用户界面的变化状态说明:设计1‑设计9主视图为数据管理展示界面。界面左侧
    显示有模型组件栏;界面的右侧显示有具体配置信息栏,具体配置信息栏左侧展示系统动
    力学变量的元属性总览栏;界面的上方显示有工具栏。界面的中部可用于展示具体的内容
    画面的画面展示区域。通过点击界面右侧的配置信息栏的任意位置,均可进行界面的跳转。
    在设计2、设计3、设计4、设计8和设计9中,界面右侧的具体信息配置栏用于显示智能体基本
    配置信息。在设计5、设计6和设计7中,界面右侧的具体信息配置栏用于显示Tabs配置信息。
    通过点击具体信息配置栏的任意位置,均可进行界面的跳转。
    8.显示屏幕面板是惯常设计,省略其他视图。
    4