分类: 强化学习 | 微笑紫瞳星

文章分类
强化学习比赛 3 c++ 1 游戏开发 28 机器学习 20 Unity强化学习 18 Markdown 1 Pycharm 3 Python 1 论文写作 3 虚幻引擎 1 强化学习 33 计算机 1 博客 2 云服务 2 投资 1 学习方法 3 浏览器脚本 1 数学 5 自控 6 其他 1 数据结构与算法 1 工具推荐 1 Node.js 2
                            
                            强化学习之SAC
                        
                                 参考视频：周博磊强化学习课程 
价值函数优化学习主线：Q-learning→DQN→DDPG→TD3→SAC
Q-Learning，DQN和DDPG请可以参考我之前的文章：强化学习实践教学
TD3可以参考我之前的博客：强化学习之TD3(p
                            
                                2021-10-06
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之TD3
                        
                                 参考视频：https://www.bilibili.com/video/BV1EK41157fD/?spm_id_from=333.788.recommend_more_video.-1 
原论文：https://arxiv.org/ab
                            
                                2021-10-06
                            
                                    强化学习
                                
                            强化学习
                        
                            基于模型的深度强化学习(Model_based RL)
                        
                                 参考视频：周博磊强化学习纲要
 阅读本文前需要对强化学习model-free领域有一定的了解，可以查看我之前的文章：《强化学习实践教学》，《强化学习纲要（周博磊课程）》
 之前介绍的算法例如DQN，DDPG，PPO都是model-free
                            
                                2021-10-05
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之DQN超级进化版Rainbow
                        
                                 阅读本文前可以先了解我前三篇文章《强化学习之DQN》《强化学习之DDQN》、《强化学习之 Dueling DQN》。
Rainbow结合了DQN算法的6个扩展改进，将它们集成在同一个智能体上，其中包括DDQN，Dueling DQN，Pr
                            
                                2021-09-25
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之DQN代码带讲解
                        
                                  本代码取自周博磊强化学习课程https://space.bilibili.com/511221970/channel/detail?cid=105354&ctype=0
源码：https://download.csdn.net/
                            
                                2021-09-13
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之PPO
                        
阅读本文前先了解TRPO算法有助于理解，我对此也写过博客：https://blog.csdn.net/tianjuewudi/article/details/120191097

参考李宏毅老师的视频：https://www.bilibi
                            
                                2021-09-08
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之TRPO
                        
                                ​       注：TRPO算是我至今遇到过的最难理解的算法了，我查了很多资料，花费好几天时间，也未曾理解，向TRPO的一作致敬。。。本文是我的查资料笔记，由于公式过多，可以先学比较重要的PPO。
​       TRPO全称为Trust 
                            
                                2021-09-03
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之A2C和A3C
                        
                                 阅读本文可参考我以前的文章《强化学习实践教学》https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-jiao-xue/#toc-heading-29，其中的连续
                            
                                2021-09-02
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之Dueling DQN
                        
                                 注：本文续于《强化学习之DDQN》
Dueling DQN的思想是把神经网络中Q价值的输出分成两部分，第一部分是状态价值V，这部分价值由状态直接决定和Action无关。第二部分就是动作价值和状态价值的差值A，每一个Action都存在一个差
                            
                                2021-08-29
                            
                                    强化学习
                                
                            强化学习
                        
                            强化学习之DDQN
                        
                                 知识基础DQN参考我的博文：https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-jiao-xue/#toc-heading-19
DQN复习​       我
                            
                                2021-08-29
                            
                                    强化学习
                                
                            强化学习