密集的强化学习以安全验证自动驾驶汽车

2025-06-25 07:09来源:本站

  阻碍自动驾驶汽车开发和部署的一种关键瓶颈是在自然主义驾驶环境中验证其安全所需的高度经济和时间成本,这是由于安全至关重要的事件的稀有性。在这里,我们报告了智能测试环境的开发,在该环境中,对基于人造的背景代理进行了培训,以验证在加速模式下自动驾驶的安全性能,而不会失去无偏见。从自然主义的驾驶数据中,背景代理商了解了通过密集的深入强化学习(D2RL)方法执行的对抗性操纵方法,其中Markov决策过程通过删除非安全关键状态并重新连接而编辑,以使训练数据中的信息在训练数据中得到密集。D2RL使神经网络能够从密集的信息中学习,并通过关键事件进行密集的信息,并实现对传统深入强化学习方法棘手的任务。我们通过在高速公路和城市测试轨道上测试具有增强真实环境的高速自动化车辆,将模拟背景车辆与物理公路基础设施和真正的自动测试工具相结合,从而证明了方法的有效性。我们的结果表明,经过D2RL训练的药物可以通过多个数量级加速评估过程(更快的103至105倍)。此外,D2RL将与其他安全至关重要的自主系统一起进行加速测试和培训。

左文资讯声明:未经许可,不得转载。