栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【假期学习计划】深度强化学习算法与应用培训班

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【假期学习计划】深度强化学习算法与应用培训班

深度强化学习应用与实战培训班内容
一、强化学习概述
二、马尔科夫决策过程
1.马尔可夫性
2.马尔可夫决策过程
3.策略与价值
4.最优化原理
5.MDPs扩展
三、动态规划
1.动态规划
2.价值迭代
3.策略迭代
4.迭代策略评估
5.广义策略迭代
6.维数灾
a.python环境下简单扫地机器人环境
b.价值迭代python实现
c.策略迭代python实现
d.迭代策略评估python实现
四、无模型预测学习
1.蒙特卡洛方法
2.时间差分学习
3.n-步回报
4.TD(lambda)
5.资格迹
a.蒙特卡洛方法python实现
b.时间差分方法python实现
五、无模型控制学习
1.蒙特卡洛控制
2.Sarsa
3.重要性采样
4.Q-学习
4.Double Q学习
5.探索与利用
a. Sarsa方法python实现
b. Q学习方法python实现
c. Sarsa(lambda)方法python实现
六、价值函数逼近
1.函数逼近器
2.线性函数逼近
3.常见的特征表示方法
4.价值迭代+离散化方法
5.Fitted Q Iteration
6.策略迭代+最小二乘
7.预测学习+随机梯度下降法
8.控制学习+随机梯度下降法
a. 离散化Q迭代方法python实现
b. LSPI方法python实现
七、策略梯度方法
1.基于策略的强化学习
2.有限差分策略梯度
3.解析法策略梯度
4.REINFORCE算法
5.Actor-Critic
6.策略梯度引入基准
7.自然梯度
8.确定型Actor-Critic
a. 策略迭代方法python实现
b. actor-critic方法python实现
八、深度强化学习
1.Deep Q learning(DQN)
2.Double DQN
3.Dueling DQN
4.Prioritized Experience Replay
5.A3C/A2C
6.DDPG
7.PPO
8.SAC
a.深度强化学习训练场-OpenAI Gym 安装与使用
b.Pytorch安装与使用
实验一:倒立摆和冰壶控制实践
实验二:OpenAI Gym实践
实验:月球飞船降落任务
实验:自动驾驶赛车任务

课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)


深度学习与图神经网络培训班内容
课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)




知识图谱培训班内容


大数据分析挖掘培训班内容


课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/269433.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号