专利检索 ap:("之江实验室" OR "浙江大学") AND inv:"陈卫" 第 1 页

1.

发明公开
一种系统动力学模型构建方法及装置有权

公开(公告)号：CN116484768A

公开(公告)日：2023-07-25

申请号：CN202310598800.7

申请日：2023-05-25

申请人： 之江实验室 , 浙江大学

发明人： 郑黄河 , 王永恒 , 曾洪海 , 王超 , 巫英才 , 金星 , 恽爽 , 陈卫 , 连建晓 , 王梦丝 , 邵彬 , 刘冰洁 , 段曼妮

IPC分类号： G06F30/28 , G06F111/10 , G06F113/08 , G06F119/14

摘要： 本说明书公开了一种系统动力学模型构建方法及装置，可以将用于构建系统动力学模型的各结构组件对应的配置代码语句和处理代码语句单独分割出来，可以使用户在需要构建系统动力学模型时，仅需要对各组件的主要参数进行配置，从而可以根据用户配置的参数实时生成由用户选定的指定编程语言编写的配置代码语句和处理代码语句，并基于生成的配置代码语句和处理代码语句构建系统动力学模型，进而可以提升系统动力学模型的构建效率。

2.

发明授权
一种系统动力学模型构建方法及装置有权

公开(公告)号：CN116484768B

公开(公告)日：2023-08-18

申请号：CN202310598800.7

申请日：2023-05-25

申请人： 之江实验室 , 浙江大学

发明人： 郑黄河 , 王永恒 , 曾洪海 , 王超 , 巫英才 , 金星 , 恽爽 , 陈卫 , 连建晓 , 王梦丝 , 邵彬 , 刘冰洁 , 段曼妮

IPC分类号： G06F30/28 , G06F111/10 , G06F113/08 , G06F119/14

摘要： 本说明书公开了一种系统动力学模型构建方法及装置，可以将用于构建系统动力学模型的各结构组件对应的配置代码语句和处理代码语句单独分割出来，可以使用户在需要构建系统动力学模型时，仅需要对各组件的主要参数进行配置，从而可以根据用户配置的参数实时生成由用户选定的指定编程语言编写的配置代码语句和处理代码语句，并基于生成的配置代码语句和处理代码语句构建系统动力学模型，进而可以提升系统动力学模型的构建效率。

3.

发明公开
一种时空预测的后继强化学习的交通信号控制方法及装置审中-实审

公开(公告)号：CN117079479A

公开(公告)日：2023-11-17

申请号：CN202311344089.9

申请日：2023-10-17

申请人： 之江实验室

发明人： 王永恒 , 王乐乐 , 巫英才 , 李炳强 , 王超 , 邵彬 , 陈卫 , 周春来

IPC分类号： G08G1/07 , G08G1/01 , G06F30/27 , G06N3/0442 , G06N3/042 , G06N3/084 , G06N3/092

摘要： 本说明书公开了一种时空预测的后继强化学习的交通信号控制方法及装置，通过引入显示的基于时空特性的交通状态预测，采用LSTM及GAT网络分别基于时间相关性、空间相关性预测未来的微观状态，智能体使用当前和预测状态进行最优决策，可以充分利用交通数据的时空相关性，提高路网的通行效率。同时，将后继特征与深度强化学习相结合，把任务的估计奖励和任务的预期特征进行分离，可以更方便地进行交通灯控制任务的转移，提升交通灯控制模型的训练速度，以及提高了交通信号灯控制的准确性和智能化。

4.

发明公开
一种强化学习模型构建方法、装置、存储介质及电子设备审中-实审

公开(公告)号：CN117035122A

公开(公告)日：2023-11-10

申请号：CN202311293168.1

申请日：2023-10-08

申请人： 之江实验室

发明人： 王永恒 , 董子铭 , 曾洪海 , 肖恒进 , 巫英才 , 王超 , 陈卫 , 邵彬 , 韩珺婷 , 鲁艺 , 金星 , 张杨

IPC分类号： G06N20/00

摘要： 本说明书公开了一种强化学习模型构建方法、装置、存储介质及电子设备。可以通过指定强化学习模型框架中为用户提供的各种类型不同的组件，使得用户仅需要选择组件、配置组件初始的参数和变量、编辑函数体组件中的逻辑、配置行为时间规则后，通过触发JEP执行器运行代码从而训练用户定义的强化学习模型，从而可以提升用户构建强化学习模型的效率。

5.

发明公开
一种基于GIS模拟智能体移动及可调速的可视化方法和装置审中-实审

公开(公告)号：CN116883633A

公开(公告)日：2023-10-13

申请号：CN202311151151.2

申请日：2023-09-07

申请人： 之江实验室

发明人： 王超 , 连建晓 , 王永恒 , 巫英才 , 陈卫 , 恽爽 , 侯锦辉 , 曾洪海 , 董子铭 , 金星 , 段曼妮

IPC分类号： G06T19/00 , G06F16/29

摘要： 本发明公开了一种基于GIS模拟智能体移动及可调速的可视化方法和装置，包括：基于智能体的坐标在地图上创建所有智能体；设定周期，获取每个智能体在每个周期的坐标信息，比较当前周期与上一周期的坐标，确定智能体是否移动，若移动，则保存该智能体在当前周期的起始坐标和目标坐标；初始化移动智能体运动前的状态，设定运动速度和单周期运动步数并计算当前周期的运动时长和单步运动时长，从而计算当前周期移动智能体的运动路径；按照运动路径在地图上模拟智能体的移动；则每个移动智能体连续多周期的运动路径即可在GIS地图上模拟智能体的移动并可视化。本发明将带有地理坐标信息的智能体真实映射到GIS地图上；且移动过程可视化的速度支持灵活设置。

6.

发明公开
一种强化学习模型训练和业务执行方法、装置及电子设备有权

公开(公告)号：CN117725985A

公开(公告)日：2024-03-19

申请号：CN202410171178.6

申请日：2024-02-06

申请人： 之江实验室

发明人： 张杨 , 王超 , 陈卫 , 陈振宇 , 王永恒 , 郑黄河 , 恽爽 , 曾洪海 , 连建晓 , 王梦丝 , 路游 , 周春来 , 鲁艺

IPC分类号： G06N3/092 , G06F30/27

摘要： 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括：获取用户针对指定业务场景构建的强化学习环境数据；响应于用户的指定操作，确定用户基于强化学习环境数据选择的目标智能体，并确定目标智能体的智能体配置信息；在预设算法库中确定出目标强化学习算法；基于目标智能体、智能体配置信息以及目标强化学习算法，构建强化学习模型，并对强化学习模型进行仿真，并将仿真过程中产生的数据存入经验回放池；根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛，充分满足了用户对强化学习环境的多样化需求。

7.

发明授权
一种基于非合作博弈的策略生成方法及装置有权

公开(公告)号：CN117252234B

公开(公告)日：2024-03-01

申请号：CN202311531148.3

申请日：2023-11-16

申请人： 之江实验室

发明人： 金星 , 王永恒 , 王超 , 张文浩 , 王震 , 张杨 , 陈卫 , 曾洪海 , 杨亚飞 , 连建晓 , 鲁艺 , 王梦丝

IPC分类号： G06N3/006 , G06N7/01

摘要： 本说明书公开了一种基于非合作博弈的策略生成方法及装置，通过构建目标用户对应的图数据，针对每个智能体，根据该智能体的被观测概率以及背叛参数，确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率，通过该智能体的惩罚参数，确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下，更新该智能体的背叛参数和惩罚参数，用于确定各智能体的行为策略。从上述方法可以看出，通过构建目标用户对应的图数据，参考了与目标用户相关用户的行为策略的影响，以及实时更新目标用户的惩罚参数和背叛参数，得到的行为策略，更准确、实效性强。(56)对比文件Marco Casari等.Decentralizedmanagement of common property resources:experiments with a centuries-oldinstitution.Journal of Economic Behavior& Organization.2003,全文.裴华艳;闫光辉;王焕民.基于行为惩罚的合作演化研究.兰州交通大学学报.2020,(02),全文.王浩云;张顺颐;赵振东;马燕玲.基于不完全信息博弈的P2P网络节点行为策略模型.应用科学学报.2008,(05),全文.于建业;王元卓;靳小龙;程学旗.基于社交演化博弈的社交网络用户信息分享行为演化分析.电子学报.2018,(01),全文.谢逢洁;武小平;崔文田;陈子凤.博弈参与水平对无标度网络上合作行为演化的影响.中国管理科学.2017,(05),全文.

8.

发明授权
一种强化学习模型构建方法、装置、存储介质及电子设备有权

公开(公告)号：CN117035122B

公开(公告)日：2024-01-26

申请号：CN202311293168.1

申请日：2023-10-08

申请人： 之江实验室

发明人： 王永恒 , 董子铭 , 曾洪海 , 肖恒进 , 巫英才 , 王超 , 陈卫 , 邵彬 , 韩珺婷 , 鲁艺 , 金星 , 张杨

IPC分类号： G06N20/00

摘要： 本说明书公开了一种强化学习模型构建方法、装置、存储介质及电子设备。可以通过指定强化学习模型框架中为用户提供的各种类型不同的组件，使得用户仅需要选择组件、配置组件初始的参数和变量、编辑函数体组件中的逻辑、配置行为时间规则后，通过触发JEP执行器运行代码从而训练用户定义的强化学习模型，从而可以提升用户构建强化学习模型的效率。

9.

发明公开
一种基于非合作博弈的策略生成方法及装置审中-公开

公开(公告)号：CN117252234A

公开(公告)日：2023-12-19

申请号：CN202311531148.3

申请日：2023-11-16

申请人： 之江实验室

发明人： 金星 , 王永恒 , 王超 , 张文浩 , 王震 , 张杨 , 陈卫 , 曾洪海 , 杨亚飞 , 连建晓 , 鲁艺 , 王梦丝

IPC分类号： G06N3/006 , G06N7/01

摘要： 本说明书公开了一种基于非合作博弈的策略生成方法及装置，通过构建目标用户对应的图数据，针对每个智能体，根据该智能体的被观测概率以及背叛参数，确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率，通过该智能体的惩罚参数，确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下，更新该智能体的背叛参数和惩罚参数，用于确定各智能体的行为策略。从上述方法可以看出，通过构建目标用户对应的图数据，参考了与目标用户相关用户的行为策略的影响，以及实时更新目标用户的惩罚参数和背叛参数，得到的行为策略，更准确、实效性强。

10.

发明授权
一种基于GIS模拟智能体移动及可调速的可视化方法和装置有权

公开(公告)号：CN116883633B

公开(公告)日：2023-12-12

申请号：CN202311151151.2

申请日：2023-09-07

申请人： 之江实验室

发明人： 王超 , 连建晓 , 王永恒 , 巫英才 , 陈卫 , 恽爽 , 侯锦辉 , 曾洪海 , 董子铭 , 金星 , 段曼妮

IPC分类号： G06T19/00 , G06F16/29

摘要： 本发明公开了一种基于GIS模拟智能体移动及可调速的可视化方法和装置，包括：基于智能体的坐标在地图上创建所有智能体；设定周期，获取每个智能体在每个周期的坐标信息，比较当前周期与上一周期的坐标，确定智能体是否移动，若移动，则保存该智能体在当前周期的起始坐标和目标坐标；初始化移动智能体运动前的状态，设定运动速度和单周期运动步数并计算当前周期的运动时长和单步运动时长，从而计算当前周期移动智能体的运动路径；按照运动路径在地图上模拟智能体的移动；则每个移动智能体连续多周期的运动路径即可在GIS地图上模拟智能体的移动并可视化。本发明将带有地理坐标信息的智能体真实映射到GIS地图上；且移动过程可视化的速度支持灵活设置。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类