-
公开(公告)号:CN112306059B
公开(公告)日:2024-02-27
申请号:CN202011104599.5
申请日:2020-10-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种控制模型的训练方法、控制方法以及装置,获取第一采集设备和第一采集设备周围的第一障碍物在设定历史时刻时的状态数据,作为第一状态数据。将第一状态数据输入到控制模型中,确定出第一采集设备在设定历史时刻之后的规划轨迹。根据规划轨迹,确定控制模型对应的奖励函数的奖励值,并根据奖励值,对控制模型进行训练。本方法通过第一采集设备和第一采集设备周围的障碍物在设定历史时刻时的状态数据,进行控制模型的训练,通过训练完成的控制模型规划轨迹,根据规划轨迹对无人驾驶设备进行控制,从而降低了无人驾驶设备与周围障碍物发生碰撞的概率。
-
公开(公告)号:CN112925210B
公开(公告)日:2021-09-07
申请号:CN202110508067.6
申请日:2021-05-11
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练和控制无人设备的方法及装置,本说明书实施例在强化学习网络之外独立设置安全性验证的模块,当强化学习网络输出的控制策略不能通过安全性验证时,采用非强化学习算法模块出的控制策略作为待优化控制策略,并以待优化控制策略所能获得的奖励最大化为目标,对强化学习网络进行训练。这样,在对包含上述强化学习网络和非强化学习算法模块的强化学习模型在训练时,既不需要高精度的虚拟仿真系统,也极大的降低了实车试验的成本,训练后的强化学习模型也能适用于多种复杂场景。
-
公开(公告)号:CN113110526A
公开(公告)日:2021-07-13
申请号:CN202110657875.9
申请日:2021-06-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置,并具体公开了,针对每个行驶场景,通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练,得到每个调整后的决策模型,再在调整后的决策模型基础上,确定出每个训练样本对应的实际行驶场景,并利用该实际行驶场景对场景行驶模型进行训练,直至确定满足预设训练条件。而后,在对无人驾驶设备进行控制时,使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景,再采用与该行驶场景相匹配的决策模型,确定无人驾驶设备对应的控制策略,并控制无人驾驶设备行驶,这样,提高了无人驾驶设备对于不同行驶场景的适应能力。
-
公开(公告)号:CN112925210A
公开(公告)日:2021-06-08
申请号:CN202110508067.6
申请日:2021-05-11
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练和控制无人设备的方法及装置,本说明书实施例在强化学习网络之外独立设置安全性验证的模块,当强化学习网络输出的控制策略不能通过安全性验证时,采用非强化学习算法模块出的控制策略作为待优化控制策略,并以待优化控制策略所能获得的奖励最大化为目标,对强化学习网络进行训练。这样,在对包含上述强化学习网络和非强化学习算法模块的强化学习模型在训练时,既不需要高精度的虚拟仿真系统,也极大的降低了实车试验的成本,训练后的强化学习模型也能适用于多种复杂场景。
-
公开(公告)号:CN112306059A
公开(公告)日:2021-02-02
申请号:CN202011104599.5
申请日:2020-10-15
Applicant: 北京三快在线科技有限公司 , 清华大学
IPC: G05D1/02
Abstract: 本说明书公开了一种控制模型的训练方法、控制方法以及装置,获取第一采集设备和第一采集设备周围的第一障碍物在设定历史时刻时的状态数据,作为第一状态数据。将第一状态数据输入到控制模型中,确定出第一采集设备在设定历史时刻之后的规划轨迹。根据规划轨迹,确定控制模型对应的奖励函数的奖励值,并根据奖励值,对控制模型进行训练。本方法通过第一采集设备和第一采集设备周围的障碍物在设定历史时刻时的状态数据,进行控制模型的训练,通过训练完成的控制模型规划轨迹,根据规划轨迹对无人驾驶设备进行控制,从而降低了无人驾驶设备与周围障碍物发生碰撞的概率。
-
公开(公告)号:CN113110526B
公开(公告)日:2021-09-24
申请号:CN202110657875.9
申请日:2021-06-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置,并具体公开了,针对每个行驶场景,通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练,得到每个调整后的决策模型,再在调整后的决策模型基础上,确定出每个训练样本对应的实际行驶场景,并利用该实际行驶场景对场景行驶模型进行训练,直至确定满足预设训练条件。而后,在对无人驾驶设备进行控制时,使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景,再采用与该行驶场景相匹配的决策模型,确定无人驾驶设备对应的控制策略,并控制无人驾驶设备行驶,这样,提高了无人驾驶设备对于不同行驶场景的适应能力。
-
公开(公告)号:CN111123957A
公开(公告)日:2020-05-08
申请号:CN202010239165.X
申请日:2020-03-31
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种轨迹规划的方法及装置,可获取无人设备轨迹规划所需的状态信息,并通过父规划模型确定状态信息对应的若干个待定行驶决策和每个待定行驶决策的决策价值,选择最大决策价值对应的待定行驶决策作为状态信息对应的行驶决策,并通过选择的行驶决策对应的子规划模型,可确定实现行驶决策的规划动作,根据规划动作,规划无人设备的轨迹。本说明书提供的轨迹规划方法适用于现有技术中的所有场景,并且无需确定所属的场景类型,解决了现有技术中场景划分不够准确合理的问题,达到了无人设备在实现最大决策价值对应的行驶决策时,规划出较好的轨迹的有益效果。
-
公开(公告)号:CN111123957B
公开(公告)日:2020-09-04
申请号:CN202010239165.X
申请日:2020-03-31
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种轨迹规划的方法及装置,可获取无人设备轨迹规划所需的状态信息,并通过父规划模型确定状态信息对应的若干个待定行驶决策和每个待定行驶决策的决策价值,选择最大决策价值对应的待定行驶决策作为状态信息对应的行驶决策,并通过选择的行驶决策对应的子规划模型,可确定实现行驶决策的规划动作,根据规划动作,规划无人设备的轨迹。本说明书提供的轨迹规划方法适用于现有技术中的所有场景,并且无需确定所属的场景类型,解决了现有技术中场景划分不够准确合理的问题,达到了无人设备在实现最大决策价值对应的行驶决策时,规划出较好的轨迹的有益效果。
-
公开(公告)号:CN113140261B
公开(公告)日:2022-05-06
申请号:CN202110448407.0
申请日:2021-04-25
Applicant: 清华大学
IPC: G16C20/10
Abstract: 本发明公开了一种化学分子合成仿真方法及装置,该方法包括:针对每一个输入组合中每一个初始形状,执行下述方法:通过遍历确定初始形状可拼接的引导分子,并进行拼接后得到第一合成形状;通过遍历确定第一合成形状上可拼接的基础分子,作为拼接分子;将其中一个拼接分子与第一合成形状拼接,得到第二合成形状,将第二合成形状作为新的初始形状,重新执行上述合成第二合成形状的方法,直至达到预设条件;选择另一个拼接分子,重复上述方法,得到初始形状可合成的所有合成形状,将所有合成形状划分为有限形状或无限形状;存储有限形状和无限形状的形状信息。本发明可以快速确定基础分子和引导分子能够合成的有限形状的数量和形状信息。
-
公开(公告)号:CN113140261A
公开(公告)日:2021-07-20
申请号:CN202110448407.0
申请日:2021-04-25
Applicant: 清华大学
IPC: G16C20/10
Abstract: 本发明公开了一种化学分子合成仿真方法及装置,该方法包括:针对每一个输入组合中每一个初始形状,执行下述方法:通过遍历确定初始形状可拼接的引导分子,并进行拼接后得到第一合成形状;通过遍历确定第一合成形状上可拼接的基础分子,作为拼接分子;将其中一个拼接分子与第一合成形状拼接,得到第二合成形状,将第二合成形状作为新的初始形状,重新执行上述合成第二合成形状的方法,直至达到预设条件;选择另一个拼接分子,重复上述方法,得到初始形状可合成的所有合成形状,将所有合成形状划分为有限形状或无限形状;存储有限形状和无限形状的形状信息。本发明可以快速确定基础分子和引导分子能够合成的有限形状的数量和形状信息。
-
-
-
-
-
-
-
-
-