-
动态规划求解强化学习问题
Wednesday, May 6, 2020
动态规划与强化学习的关系 动态规划的关键点在于:(1)问题的最优解可以由若干个小问题的最优解构成,即通过寻找子问题的最优解可以得到问题的最优解…more
-
强化学习基础
Wednesday, May 6, 2020
强化学习基本要素 环境状态\(S\), t时刻环境的状态\(S_t\)是它的环境状态集中的某一个状态。 个体动作\(A\), t时刻个体采取的动作\…more
-
马尔可夫决策过程
Wednesday, May 6, 2020
引入马尔可夫决策过程(MDP) 在强化学习基础介绍的强化学习要素中,状态转移概率\(P_{ss'}^a\)不仅与上一个状态有关,也与之前所有状…more
-
强化学习入门资料
Wednesday, April 8, 2020
阅读书目 PRML / 国内有非正式版翻译 Reinforcement learning: An Introduction / 有中文版 Artificial intelligence: A Modern Approach Part I-III / 有中文 翻译一般 比较general的书 Deep learning / 花书 Artificial Intelligence and Games / 有中文版 翻译质量还行…more