发表评论取消回复
相关阅读
相关 深度强化学习(DRL 2) - 强化学习环境Gym
目录 [一、选择框架][Link 1] [二、认识Gym][Gym] [三、从代码开始][Link 2] 一、选择框架 R
相关 强化学习系列之翻译OpenAI用户手册(二)
强化学习系列文章 [第一章 强化学习入门][Link 1] [第二章 翻译OpenAI用户手册][OpenAI](一) [第三章 翻译OpenAI用户手册][OpenAI
相关 强化学习:Q-学习
这篇教程通过简单且易于理解的实例介绍了Q-学习的概念知识,例子描述了一个智能体通过非监督学习的方法对未知的环境进行学习。 假设我们的楼层内共有5个房间,房间之间通过一道门相
相关 强化学习五、时间差分(二)
前面已经讨论了基本的时间差分的预测方法[强化学习(五):时间差分(一)][Link 1],本节将介绍时间差分在控制方面的两个算法SARSA和Q-learning,分别为on-p
相关 强化学习二、MDP
前面已经讲解了什么是强化学习,也以Maze游戏为例形象的介绍了强化学习涉及到的主要概念:S、A、P、R、γ,但并未涉及到数学公式。想了解强化学习的朋友可以参考链
还没有评论,来说两句吧...