-
公开(公告)号:CN116088476B
公开(公告)日:2024-09-24
申请号:CN202310070263.9
申请日:2023-01-12
申请人: 清华大学
IPC分类号: G05B23/02
摘要: 本文公开一种实现自适应加速测试评估的方法及装置,包括:对从第二次开始的自适应加速测试,根据i‑1次之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的重要性采样函数,确定测试场景Xi;在测试场景Xi中进行自适应加速测试,获得第i次的测试结果;根据获得的测试结果,确定基于控制变量的自适应加速评估方法的控制参数;根据确定的控制参数,计算第i次自适应加速测试的测试指标;根据测试指标判断出测试结果收敛时,将测试指标作为测试评估结果。本发明实施例通过结合多重重要性采样的自适应加速测试与基于控制变量的自适应加速评估,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。
-
公开(公告)号:CN118245763A
公开(公告)日:2024-06-25
申请号:CN202410382456.2
申请日:2024-03-29
申请人: 清华大学
IPC分类号: G06F18/21 , G06F18/2415
摘要: 本申请公开一种表格型密集强化学习方法、计算机存储介质及终端,包括:从关键状态集合中均匀采样初始状态,使得初始状态均为关键状态;根据学习率、时序差分误差及关键状态集合的示性函数,对未达到最优的兴趣事件的发生概率Q(s,a)进行更新学习。本公开实施例从关键状态集合中均匀采样初始状态,基于包含关键状态集合的示性函数实现兴趣事件的发生概率Q(s,a)的更新学习,使得训练数据包含的关键状态信息密集化,减少了计算量、节省了计算资源,提升了未达到最优的兴趣事件的发生概率Q(s,a)的学习效率。
-
公开(公告)号:CN116009516B
公开(公告)日:2024-09-24
申请号:CN202310063836.5
申请日:2023-01-12
申请人: 清华大学
IPC分类号: G05B23/02
摘要: 本文公开一种实现自适应加速测试的方法及装置,包括:根据第i‑1次及之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的第i次自适应加速测试的重要性采样函数,采样确定第i次自适应测试的测试场景Xi;在采样确定的第i次自适应测试的测试场景Xi中对自动驾驶汽车进行自适应加速测试,获得测试结果;根据获得的测试结果,确定测试场景Xi的自适应加速测试的测试指标;根据确定的测试指标判断出测试结果收敛时,将确定的测试指标确定为测试评估结果。本发明实施例通过多重重要性采样函数的确定,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。
-
公开(公告)号:CN116088476A
公开(公告)日:2023-05-09
申请号:CN202310070263.9
申请日:2023-01-12
申请人: 清华大学
IPC分类号: G05B23/02
摘要: 本文公开一种实现自适应加速测试评估的方法及装置,包括:对从第二次开始的自适应加速测试,根据i‑1次之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的重要性采样函数,确定测试场景Xi;在测试场景Xi中进行自适应加速测试,获得第i次的测试结果;根据获得的测试结果,确定基于控制变量的自适应加速评估方法的控制参数;根据确定的控制参数,计算第i次自适应加速测试的测试指标;根据测试指标判断出测试结果收敛时,将测试指标作为测试评估结果。本发明实施例通过结合多重重要性采样的自适应加速测试与基于控制变量的自适应加速评估,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。
-
公开(公告)号:CN118297143A
公开(公告)日:2024-07-05
申请号:CN202410381743.1
申请日:2024-03-29
申请人: 清华大学
IPC分类号: G06N5/01 , G01M17/007
摘要: 本申请公开一种自适应测试策略调整方法及装置,本申请通过自适应搜索策略搜索到的状态动作对,平衡状态动作空间的探索与代理偏差并考虑自然驾驶环境中动作出现概率,提高了多个代理模型组合系数的调整效率,基于确定的组合系数执行自动驾驶汽车的测试,提高了自动驾驶汽车测试的鲁棒性以及测试评估的效率。
-
公开(公告)号:CN118226755A
公开(公告)日:2024-06-21
申请号:CN202410382530.0
申请日:2024-03-29
申请人: 清华大学
IPC分类号: G05B13/04
摘要: 本申请公开一种自适应测试评估的方法、装置、计算机存储介质及终端,本公开实施例根据测试场景中包含的关键变量的个数将场景空间按层划分,基于每一层场景空间的第一控制参数和预先确定的每一层场景空间的重要性采样函数,确定每一层场景空间的稀疏控制变量;基于确定的每一层场景空间的稀疏控制变量,对每一层场景空间的测试结果进行估计,获得每一层场景空间的事故率;基于每一层场景空间的第一控制参数和每一层场景空间的事故率,获得自动驾驶汽车测试评估的全场景空间的事故率;可适用于高维测试环境,实现了自动驾驶汽车的高效测试评估。
-
公开(公告)号:CN118535992A
公开(公告)日:2024-08-23
申请号:CN202410585343.2
申请日:2024-05-11
申请人: 清华大学
IPC分类号: G06F18/2415 , G06F18/214
摘要: 一种稀疏关键度预测模型训练方法、预测系统和方法,所述训练方法包括:获取智能系统安全关键事件发生时的正样本集P和不发生时的负样本集N,根据P和N进行第一阶段无监督奖励模型训练,排除N中简单负样本,保留假性正样本;基于正样本集P和假性正样本构建正样本集P2和负样本集N2,进行第二阶段基于改进双支网络的有监督分类模型的训练,获得难例分类模型;获取关键数据作为第三阶段训练数据,对难例分类模型进行提高分类准确度的基于密集强化学习方法的第三阶段微调,获得稀疏关键度预测模型,能有效解决安全关键事件环境变量的稀疏度灾难,解决了极度不平衡数据集的学习问题,获得了高精度的智能系统安全关键事件概率预测模型。
-
公开(公告)号:CN116009516A
公开(公告)日:2023-04-25
申请号:CN202310063836.5
申请日:2023-01-12
申请人: 清华大学
IPC分类号: G05B23/02
摘要: 本文公开一种实现自适应加速测试的方法及装置,包括:根据第i‑1次及之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的第i次自适应加速测试的重要性采样函数,采样确定第i次自适应测试的测试场景Xi;在采样确定的第i次自适应测试的测试场景Xi中对自动驾驶汽车进行自适应加速测试,获得测试结果;根据获得的测试结果,确定测试场景Xi的自适应加速测试的测试指标;根据确定的测试指标判断出测试结果收敛时,将确定的测试指标确定为测试评估结果。本发明实施例通过多重重要性采样函数的确定,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。
-
-
-
-
-
-
-