-
公开(公告)号:CN112925210A
公开(公告)日:2021-06-08
申请号:CN202110508067.6
申请日:2021-05-11
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练和控制无人设备的方法及装置,本说明书实施例在强化学习网络之外独立设置安全性验证的模块,当强化学习网络输出的控制策略不能通过安全性验证时,采用非强化学习算法模块出的控制策略作为待优化控制策略,并以待优化控制策略所能获得的奖励最大化为目标,对强化学习网络进行训练。这样,在对包含上述强化学习网络和非强化学习算法模块的强化学习模型在训练时,既不需要高精度的虚拟仿真系统,也极大的降低了实车试验的成本,训练后的强化学习模型也能适用于多种复杂场景。
-
公开(公告)号:CN112925210B
公开(公告)日:2021-09-07
申请号:CN202110508067.6
申请日:2021-05-11
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练和控制无人设备的方法及装置,本说明书实施例在强化学习网络之外独立设置安全性验证的模块,当强化学习网络输出的控制策略不能通过安全性验证时,采用非强化学习算法模块出的控制策略作为待优化控制策略,并以待优化控制策略所能获得的奖励最大化为目标,对强化学习网络进行训练。这样,在对包含上述强化学习网络和非强化学习算法模块的强化学习模型在训练时,既不需要高精度的虚拟仿真系统,也极大的降低了实车试验的成本,训练后的强化学习模型也能适用于多种复杂场景。
-
公开(公告)号:CN113110526A
公开(公告)日:2021-07-13
申请号:CN202110657875.9
申请日:2021-06-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置,并具体公开了,针对每个行驶场景,通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练,得到每个调整后的决策模型,再在调整后的决策模型基础上,确定出每个训练样本对应的实际行驶场景,并利用该实际行驶场景对场景行驶模型进行训练,直至确定满足预设训练条件。而后,在对无人驾驶设备进行控制时,使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景,再采用与该行驶场景相匹配的决策模型,确定无人驾驶设备对应的控制策略,并控制无人驾驶设备行驶,这样,提高了无人驾驶设备对于不同行驶场景的适应能力。
-
公开(公告)号:CN113110526B
公开(公告)日:2021-09-24
申请号:CN202110657875.9
申请日:2021-06-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置,并具体公开了,针对每个行驶场景,通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练,得到每个调整后的决策模型,再在调整后的决策模型基础上,确定出每个训练样本对应的实际行驶场景,并利用该实际行驶场景对场景行驶模型进行训练,直至确定满足预设训练条件。而后,在对无人驾驶设备进行控制时,使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景,再采用与该行驶场景相匹配的决策模型,确定无人驾驶设备对应的控制策略,并控制无人驾驶设备行驶,这样,提高了无人驾驶设备对于不同行驶场景的适应能力。
-
公开(公告)号:CN113486452B
公开(公告)日:2022-07-15
申请号:CN202111040789.X
申请日:2021-09-07
Applicant: 北京三快在线科技有限公司
IPC: G06F30/15 , G06F30/27 , G06N3/04 , G06N3/08 , G06F111/04 , G06F111/08 , G06F119/12
Abstract: 本说明书公开了一种用于无人驾驶设备远程遥控的方法及装置,首先,接收无人驾驶设备发送的接管请求。其次,将传感数据输入到预先训练的风险模型中,确定接管请求对应的优先级。而后,针对每个候选远程遥控设备,根据接管请求对应的优先级,以及预先确定出的在该候选远程遥控设备对应的请求队列中当前持有的待处理请求数量的前提下所对应的平均等待时长,确定该候选远程遥控设备针对接管请求的收益值。最后,根据各候选远程遥控设备针对接管请求的收益值,通过选取出的目标远程遥控设备,对无人驾驶设备进行控制。本方法可以通过各候选远程遥控设备针对接管请求的收益值,将接管请求合理的分配给远程遥控设备,从而提高了处理接管请求的效率。
-
公开(公告)号:CN113848913A
公开(公告)日:2021-12-28
申请号:CN202111141446.2
申请日:2021-09-28
Applicant: 北京三快在线科技有限公司
IPC: G05D1/02
Abstract: 本说明书公开了一种无人驾驶设备的控制方法及控制装置,该无人驾驶设备的控制方法包括:获取无人驾驶设备当前时刻的车辆状态和路况信息,根据车辆状态和路况信息,确定各换道决策,以及,将车辆状态和路况信息输入到预先训练的权重模型,确定无人驾驶设备在当前路况信息对应的环境中行驶时,换道决策中包含的各决策因子对应的偏好权重,针对每个换道决策,根据偏好权重,以及该换道决策中的各决策因子,确定在当前环境下该换道决策与无人驾驶设备之间的适配度,作为该换道决策对应的适配度,根据每个换道决策对应的适配度,从各换道决策中选取目标换道决策,并按照所述目标换道决策,对无人驾驶设备进行控制。
-
公开(公告)号:CN112990375B
公开(公告)日:2021-09-24
申请号:CN202110468540.2
申请日:2021-04-29
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备,本说明书实施例根据输入预测模型的第一样本集中的每个样本所对应的目标物的预测轨迹,对第一样本集中的样本进行筛选,得到训练样本。然后,根据训练样本对该预测模型进行训练。将第一样本集中除训练样本之外的样本重新确定为第一样本集,并不断迭代上述的训练过程,直到满足训练停止条件为止。在此方法中,在对预测模型进行训练时,只采用筛选出的训练样本训练该预测模型,而不是采用第一样本集中的所有样本训练该预测模型,这样可以减小预测模型训练过程中的计算量。
-
公开(公告)号:CN112990758A
公开(公告)日:2021-06-18
申请号:CN202110397322.4
申请日:2021-04-14
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种远程控制无人驾驶设备的方法及装置,服务平台可以获取目标区域内的各路线,并将各路线对应的路线信息输入到预先训练的预测模型,得到预测出的该目标区域对应的远程控制次数,并针对每个候选操控员数量,根据该远程控制次数,确定以该候选操控员数量的操控员对无人驾驶设备进行远程控制,无人驾驶设备的平均等待时长,作为该候选操控员数量对应的平均等待时长,以及根据各候选操控员数量对应的平均等待时长,从各候选操控员数量中选取出操控员配置数量,并按照该操控员配置数量,为目标区域分配操控员,以及通过为目标区域分配的操控员对目标区域中的无人驾驶设备进行远程控制。本方法可以为目标区域选取出合适的操控员数量。
-
公开(公告)号:CN112990375A
公开(公告)日:2021-06-18
申请号:CN202110468540.2
申请日:2021-04-29
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备,本说明书实施例根据输入预测模型的第一样本集中的每个样本所对应的目标物的预测轨迹,对第一样本集中的样本进行筛选,得到训练样本。然后,根据训练样本对该预测模型进行训练。将第一样本集中除训练样本之外的样本重新确定为第一样本集,并不断迭代上述的训练过程,直到满足训练停止条件为止。在此方法中,在对预测模型进行训练时,只采用筛选出的训练样本训练该预测模型,而不是采用第一样本集中的所有样本训练该预测模型,这样可以减小预测模型训练过程中的计算量。
-
公开(公告)号:CN112987754A
公开(公告)日:2021-06-18
申请号:CN202110397319.2
申请日:2021-04-14
Applicant: 北京三快在线科技有限公司
IPC: G05D1/02
Abstract: 本说明书公开了一种无人设备的控制方法、装置、存储介质及电子设备,本说明书实施例不止根据单独的一帧当前图像确定控制策略,而是根据当前图像和若干历史时刻的环境图像,分别确定当前时刻无人设备的安全性表征值和每个历史时刻无人设备的安全性表征值,再根据无人设备当前的安全性表征值和各历史时刻的安全性表征值,确定无人设备在下一时刻的控制策略,使得确定出的各控制策略更加平滑,不会发生跳变,无人设备按照确定出的控制策略进行自主控制时,可提高乘坐的体感舒适性。
-
-
-
-
-
-
-
-
-