微笑紫瞳星

微笑紫瞳星

本站记录本人各种学习的旅途，用于巩固自我并启发后来人

多智能体强化学习之MAPPO

强化学习

强化学习

发布日期: 2021-10-28

更新日期: 2021-10-28

论文原文：The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

参考博文如下：

MAPPO在多智能体合作场景中的惊人表现

MAPPO:The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games

多智能体强化学习(二) MAPPO算法详解

github代码：

MAPPO官方代码链接：https://github.com/marlbenchmark/on-policy

轻量版MAPPO，易移植：https://github.com/tinyzqh/light_mappo

MAPPO算法，是强化学习单智能体算法PPO在多智能体领域的改进。

此算法暂时先参考别人的博文，等我实际运用过，有了更深的理解之后，再来完善本内容。

微笑紫瞳星

http://zhongxinjian.top/2021/10/28/%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E4%B9%8BMAPPO/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源微笑紫瞳星 !

强化学习

上一篇

多任务深度强化学习入门

多任务深度强化学习入门

2021-10-28 强化学习

强化学习

下一篇

多智能体强化学习之QMIX

多智能体强化学习之QMIX

2021-10-26 强化学习

强化学习