多智能体强化学习之MAPPO


论文原文:The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

参考博文如下:

MAPPO在多智能体合作场景中的惊人表现

MAPPO:The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games

多智能体强化学习(二) MAPPO算法详解

github代码:

MAPPO官方代码链接:https://github.com/marlbenchmark/on-policy

轻量版MAPPO,易移植:https://github.com/tinyzqh/light_mappo

MAPPO算法,是强化学习单智能体算法PPO在多智能体领域的改进。

此算法暂时先参考别人的博文,等我实际运用过,有了更深的理解之后,再来完善本内容。


文章作者: 微笑紫瞳星
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 微笑紫瞳星 !
  目录