以此博客记录我的成长轨迹,与诸君共勉
多任务深度强化学习入门 多任务深度强化学习入门
理论概述 多任务深度强化学习,英文Multi-Task Deep Reinforcement Learning ,简称MTDRL或MTRL。于MARL不同,它可以是单智能体多任务的情况,也可以是多智能体多任务的情况。 现在的深度强化学习领域
2021-10-28
多智能体强化学习之MAPPO 多智能体强化学习之MAPPO
论文原文:The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games 参考博文如下: MAPPO在多智能体合作场景中的惊人表现 MAPPO:The Surpri
2021-10-28
多智能体强化学习之QMIX 多智能体强化学习之QMIX
论文:QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning参考博客:多智能体强化学习入门(五)——QMIX算法分析、
2021-10-26
多智能体强化学习之MADDPG 多智能体强化学习之MADDPG
论文原文:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments 论文翻译:MADDPG翻译 阅读本文需要强化学习基础,可以参考我前面的文章:多智能体
2021-10-25
分布式强化学习之IMPALA 分布式强化学习之IMPALA
该方法及其它的变体一直主宰MTDRL,是AlphaStar所采用的基本训练方法,这就是目标性能最佳的异步RL框架————IMPALA!
2021-10-14
分布式强化学习之D4PG 分布式强化学习之D4PG
D4PG全称Distributed Distributional Deterministic Policy Gradient,是总所周知的DDPG的分布式版本。因此学习D4PG之前,需要了解DDPG。 首先DDPG是DQN在连续空间的版本
2021-10-14
分层强化学习(Hierarchy RL) 分层强化学习(Hierarchy RL)
强化学习的研究方向之一。
2021-10-12
分布式强化学习 分布式强化学习
参考视频:周博磊强化学习纲要 阅读本文需要强化学习基础,可以阅读我以前的文章:强化学习纲要(周博磊课程)、强化学习实践教学 分布式系统一般情况下我们做的论文课题都是小规模的,使用的都是一个相对较小的数据库,因此使用单机系统基本可以完成任务
2021-10-10
模仿学习(Imitation Learning) 模仿学习(Imitation Learning)
在游戏中,我们往往有一个计分板准确定义事情的好坏程度。但现实中,定义Reward有可能是非常困难的,并且人定的reward也有可能存在许多意想不到的缺陷。在没有reward的情况下,让AI跟环境互动的一个方法叫做Imitation-Lear
2021-10-10
2 / 4