【假期学习计划】深度强化学习算法与应用培训班

深度强化学习应用与实战培训班内容
一、强化学习概述
二、马尔科夫决策过程
1.马尔可夫性
2.马尔可夫决策过程
3.策略与价值
4.最优化原理
5.MDPs扩展
三、动态规划
1.动态规划
2.价值迭代
3.策略迭代
4.迭代策略评估
5.广义策略迭代
6.维数灾
a.python环境下简单扫地机器人环境
b.价值迭代python实现
c.策略迭代python实现
d.迭代策略评估python实现
四、无模型预测学习
1.蒙特卡洛方法
2.时间差分学习
3.n-步回报
4.TD(lambda)
5.资格迹
a.蒙特卡洛方法python实现
b.时间差分方法python实现
五、无模型控制学习
1.蒙特卡洛控制
2.Sarsa
3.重要性采样
4.Q-学习
4.Double Q学习
5.探索与利用
a. Sarsa方法python实现
b. Q学习方法python实现
c. Sarsa(lambda)方法python实现
六、价值函数逼近
1.函数逼近器
2.线性函数逼近
3.常见的特征表示方法
4.价值迭代+离散化方法
5.Fitted Q Iteration
6.策略迭代+最小二乘
7.预测学习+随机梯度下降法
8.控制学习+随机梯度下降法
a. 离散化Q迭代方法python实现
b. LSPI方法python实现
七、策略梯度方法
1.基于策略的强化学习
2.有限差分策略梯度
3.解析法策略梯度
4.REINFORCE算法
5.Actor-Critic
6.策略梯度引入基准
7.自然梯度
8.确定型Actor-Critic
a. 策略迭代方法python实现
b. actor-critic方法python实现
八、深度强化学习
1.Deep Q learning(DQN)
2.Double DQN
3.Dueling DQN
4.Prioritized Experience Replay
5.A3C/A2C
6.DDPG
7.PPO
8.SAC
a.深度强化学习训练场-OpenAI Gym 安装与使用
b.Pytorch安装与使用
实验一：倒立摆和冰壶控制实践
实验二：OpenAI Gym实践
实验：月球飞船降落任务
实验：自动驾驶赛车任务

课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

深度学习与图神经网络培训班内容
课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

知识图谱培训班内容

大数据分析挖掘培训班内容

课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

【假期学习计划】深度强化学习算法与应用培训班

Python相关栏目本月热门文章