下载此文档

基于sac的自动驾驶车辆控制方法应用宁强.pdf

文档分类：汽车/机械/制造 | 页数：约14页举报非法文档有奖

1/14

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/14 下载此文档

文档列表 文档介绍

: .
计算机工程与了改善 SAC(Soft Actor Critic)算法样本等概率采样以及网络随机初始化造成网络收敛速度慢、
训练过程不稳定问题，提出一种结合优先级回放和专家数据的改进算法 PE-SAC(Priority playback soft Actor
Critic with expert)。该算法依据样本价值将样本池分类，使用专家数据预训练网络，缩小无人车无效探索空
间、降低试错次数，有效提升算法学习效率。同时设计一种面向多障碍物的奖励函数增强算法适用性。在
CARLA 平台进行仿真实验，结果表明所提出方法可以更好的控制无人车在环境中安全行驶，同等训练次数
下所得奖励值和收敛速度优于 TD3(Twin Delayed Deep Deterministic policy gradient algorithm)和 SAC 算法。
最后，结合雷达点云地图与 PID(Proportional Integral Derivative)控制方法缩小仿真环境与真实场景差异性，
将训练所得模型移植到园区低速无人车中验证算法泛用性。
关键词：深度强化学习；无人驾驶控制；现实场景
文献标志码：A 文献标识码：TP391 doi：.1002--0084

Application of SAC-based Autonomous Vehicle Control Method
NING Qiang1, LIU Yuansheng1,2*, XIE Longyang3
of Smart City, Beijing Union University, Beijing 100101, China
Engineering Research Center of Smart Mechanical Innovation Design Service, Beijing 100101, China
Key Laboratory of Information Service Engineering, Beijing Union University, Beijing 100101, China
Abstract：In order to improve the problem of slow network convergence and unstable training process caused by
equal probability sampling of SAC (Soft Actor Critic) algorithm samples and random initialization of the network,
an improved algorithm PE-SAC (Priority playback soft Actor) is proposed that combines priority playback and
expert data. Critic with expert). The algorithm classifies the sample pool according to the sample value, uses expert
data to pre-train the network,

基于sac的自动驾驶车辆控制方法应用宁强来自淘豆网m.daumloan.com转载请标明出处.

基于sac的自动驾驶车辆控制方法应用宁强.pdf

基于道路势场的智能车辆机动驾驶控制算法

自动档车辆驾驶方法

自动驾驶车辆侧向控制算法研究

基于视觉的无人驾驶车辆运动控制的研究

自动驾驶履带车辆鲁棒自适应轨迹跟踪控制方法

基于自适应MPC的自动驾驶汽车轨迹跟踪控制

基于MPC的自动驾驶车辆横向路径跟踪控制

自动档车辆驾驶方法

基于汽车驾驶模拟器车辆自动驾驶研究

自动档车辆驾驶方法

基于sac的自动驾驶车辆控制方法应用 宁强.pdf

基于sac的自动驾驶车辆控制方法应用宁强.pdf