- 强化学习与电机控制
- 强化学习控制算法分类
- 一、参考文献
- 二、后续计划
- 1. 基于MATLAB环境创建智能体对比不同控制算法下控制性能
- 2. 基于python 飞桨平台 结合fmi标准导入电机模型,进行控制算法的设计和实现
- 总结
强化学习控制算法分类
提示:这里可以添加本文要记录的大概内容:
目前主要有qlearning ddpg 和td3几种。
https://github.com/mathworks/MathWorks-Excellence-in-Innovation
MATLAB 官网提供的永磁电机电流控制链接
matlab github主页上提供了一个研究思路。
TD3算法
- TD3:Twin Delayed Deep Deterministic Policy Gradient ,双延迟深度确定性策略梯度。
- Deep Deterministic Policy Gradient, DDPG算法 不了解的可以看这里。
- TD3算法是一个对DDPG优化的版本,即TD3也是一种基于AC架构的面向连续动作空间的DRL算法,主要包括三个非常主要的优化。
强化学习是一种不依赖模型的控制算法,在控制目标设计上具有很强的灵活性。结合传统的电机控制算法还是比较有研究价值的。



