参考视频:周博磊强化学习纲要
阅读本文前需要对强化学习model-free领域有一定的了解,可以查看我之前的文章:《强化学习实践教学》,《强化学习纲要(周博磊课程)》
之前介绍的算法例如DQN,DDPG,PPO都是model-free
2021-10-05