SayuriBlog
  • 动态规划求解强化学习问题

    Wednesday, May 6, 2020

    动态规划与强化学习的关系 动态规划的关键点在于:(1)问题的最优解可以由若干个小问题的最优解构成,即通过寻找子问题的最优解可以得到问题的最优解…more

    强化学习

  • 强化学习基础

    Wednesday, May 6, 2020

    强化学习基本要素 环境状态\(S\), t时刻环境的状态\(S_t\)是它的环境状态集中的某一个状态。 个体动作\(A\), t时刻个体采取的动作\…more

    强化学习

  • 马尔可夫决策过程

    Wednesday, May 6, 2020

    引入马尔可夫决策过程(MDP) 在强化学习基础介绍的强化学习要素中,状态转移概率\(P_{ss'}^a\)不仅与上一个状态有关,也与之前所有状…more

    强化学习

  • 强化学习入门资料

    Wednesday, April 8, 2020

    阅读书目 PRML / 国内有非正式版翻译 Reinforcement learning: An Introduction / 有中文版 Artificial intelligence: A Modern Approach Part I-III / 有中文 翻译一般 比较general的书 Deep learning / 花书 Artificial Intelligence and Games / 有中文版 翻译质量还行…more

    强化学习资料推荐

  • 1
  • 2
  • 3
  • 4
  • 5

©2020 Sayuri2333.

Powered by Hugo and the Notepadium