以此博客记录我的成长轨迹,与诸君共勉
WSL2端配置pytorch GPU加速环境 WSL2端配置pytorch GPU加速环境
Windows端Pytorch GPU加速的教程:Pytorch使用GPU加速的步骤 前置教程:WSL2安装及其python环境配置 配置好WSL2相关环境后,要想对pytorch进行GPU加速,需要进行以下步骤: 更新Windows系
2022-01-22
Win10下使用WSL2安装Linux及配置python环境 Win10下使用WSL2安装Linux及配置python环境
简介WSL,全称Windows Subsystem for Linux,这是一个Windows下的子系统,允许开发人员直接在Windows下运行Linux环境,简单,便捷,高效。无需虚拟机,Windows下一键打开就能立即使用。 WSL2是
2022-01-17
offline强化学习之Revive SDK的使用 offline强化学习之Revive SDK的使用
官网:https://www.revive.cn/ 官方教程:https://revive.cn/help/polixir-revive-sdk/index.html 面临的挑战强化学习自主试错学习的方式,减少了对人力的依赖,也因此被Dee
2022-01-17
训练流程:强化学习落地挑战赛——学习指定平等的促销策略 训练流程:强化学习落地挑战赛——学习指定平等的促销策略
比赛中详细专业的的强化学习训练流程,对以后的强化学习的训练有着重要的认知作用
多智能体强化学习算法MA-POCA 多智能体强化学习算法MA-POCA
论文原文:On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning 预备知识参考: 强化学习纲要(周博磊课程) 强化学习实践教学 多智能
2021-12-29
论文阅读:Variational Discriminator Bottleneck 论文阅读:Variational Discriminator Bottleneck
对判别器进行信息约束来达到更为稳定的生成对抗训练
2021-12-24
ML-Agents中的模仿学习 ML-Agents中的模仿学习
简介 模仿学习是强化学习的好伙伴,使用模仿学习可以让智能体在比强化学习短得多的时间内得到与人类操作相近的结果,但是这种做法并不能超越人类,而强化学习能够得到远超人类的智能体,但训练时间往往非常漫长。因此我们希望让智能体并不是从零开始学,我们
ML-Agents案例之“硬核排序” ML-Agents案例之“硬核排序”
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定的
ML-Agents案例之看图记忆 ML-Agents案例之看图记忆
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定
ML-Agents案例之机器人学走路 ML-Agents案例之机器人学走路
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定
ML-Agents案例之蠕虫 ML-Agents案例之蠕虫
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一
5 / 12