归档: 2021 | 微笑紫瞳星

2021

12

31

赛题分析：AI决策•强化学习落地挑战赛——学习指定平等的促销策略

一场炼丹师之间的切磋较量

2021-12-31 强化学习比赛

强化学习强化学习比赛

29

多智能体强化学习算法MA-POCA

论文原文：On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning 预备知识参考：强化学习纲要（周博磊课程）强化学习实践教学多智能

2021-12-29 强化学习

强化学习

24

论文阅读：Variational Discriminator Bottleneck

对判别器进行信息约束来达到更为稳定的生成对抗训练

2021-12-24 强化学习

强化学习

15

ML-Agents中的模仿学习

简介模仿学习是强化学习的好伙伴，使用模仿学习可以让智能体在比强化学习短得多的时间内得到与人类操作相近的结果，但是这种做法并不能超越人类，而强化学习能够得到远超人类的智能体，但训练时间往往非常漫长。因此我们希望让智能体并不是从零开始学，我们

2021-12-15 Unity强化学习

强化学习 ML-Agents

13

ML-Agents案例之“硬核排序”

本案例源自ML-Agents官方的示例，Github地址：https://github.com/Unity-Technologies/ml-agents，本文是详细的配套讲解。本文基于我前面发的两篇文章，需要对ML-Agents有一定的

2021-12-13 Unity强化学习

强化学习 ML-Agents

12

ML-Agents案例之看图记忆

本案例源自ML-Agents官方的示例，Github地址：https://github.com/Unity-Technologies/ml-agents，本文是详细的配套讲解。本文基于我前面发的两篇文章，需要对ML-Agents有一定

2021-12-12 Unity强化学习

强化学习 ML-Agents

12

ML-Agents案例之机器人学走路

本案例源自ML-Agents官方的示例，Github地址：https://github.com/Unity-Technologies/ml-agents，本文是详细的配套讲解。本文基于我前面发的两篇文章，需要对ML-Agents有一定

2021-12-12 Unity强化学习

强化学习 ML-Agents

04

ML-Agents案例之蠕虫

本案例源自ML-Agents官方的示例，Github地址：https://github.com/Unity-Technologies/ml-agents，本文是详细的配套讲解。本文基于我前面发的两篇文章，需要对ML-Agents有一

2021-12-04 Unity强化学习

强化学习 ML-Agents

02

强化学习中的好奇心奖励机制

参考视频：李宏毅强化学习系列参考论文： Large-Scale Study of Curiosity-Driven Learning Curiosity-driven Exploration by Self-supervised Pred

2021-12-02 强化学习

强化学习

11

30

ML-Agents案例之金字塔

本案例源自ML-Agents官方的示例，Github地址：https://github.com/Unity-Technologies/ml-agents，本文是详细的配套讲解。本文基于我前面发的两篇文章，需要对ML-Agents有一

2021-11-30 Unity强化学习

强化学习 ML-Agents