作者:
出版社:
本书介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了算法之间的内在联系。
本书旨在培养胜任基础教育科研任务、具有创新精神的实践能力的高素质、研究型教师。全书突出教育研究方法的科学性、实用性和操作性,着重介绍中小学教师开展教育研究所必须掌握的基础知识、基本方法和一般步骤,辅以大量实例,帮助读者树立明确的教师研究意识,提高读者应用教育研究解决教育实践问题的能力。