深入浅出强化学习：原理入门-图书

推荐3
收藏9
浏览4.3K

深入浅出强化学习：原理入门

郭宪方勇纯 (作者)　

书　　号：978-7-121-32918-0
出版日期：2018-01-01
页　　数：
开　　本：
出版状态：上市销售
维护人：刘皎

电子书￥49.00

购买电子书

纸质版￥79.00

本书用通俗易懂的语言深入浅出地介绍了强化学习的基本原理，覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手，将强化学习问题纳入到严谨的数学框架中，接着阐述了解决此类问题最基本的方法——动态规划方法，并从中总结出解决强化学习问题的基本思路：交互迭代策略评估和策略改善。

基于这个思路，分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

除了系统地介绍基本理论，书中还介绍了相应的数学基础和编程实例。因此，本书既适合
零基础的人员入门学习、也适合相关科研人员作为研究参考。

零起点入门掌握AlphaGo的核心强化学习算法，原理分析+编程实践。从马尔科夫决策过程的动态规划方法一直讲到最前沿的深度强化学习，思路明确、清晰易懂！深度学习必备参考书！人工智大牛深度好评！
叙述简洁、直接、清晰，值得精读！

郭宪
南开大学计算机与控制工程学院博士后。2009 年毕业于华中科技大学机械设计制造及自动化专业，同年保送到中国科学院沈阳自动化研究所进行硕博连读，主攻机器人动力学建模与控制，于 2016 年 1 月获得工学博士学位，期间在国内外知名杂志和会议发表论文数 10 篇。2016 年以来，郭博士主攻方向为机器人智能感知和智能决策，目前主持两项国家级课题，内容涉及深度学习，深度强化学习等智能算法在机器人领域中的应用。

方勇纯
南开大学教授、博士生导师、计算机与控制工程学院副院长、控制科学与工程一级学科学位分委员会主席，2017年度第七届吴文俊人工智能科学技术自然科学奖一等奖获得者。分别于1996年和1999年获得浙江大学本科和硕士学位，2002年获美国克莱姆森大学博士学位，2002年至2003年在美国康乃尔大学进行博士后研究。2003年至今任教于南开大学。2013年获得国家自然科学基金杰出青年基金资助。

读者评论

请问第151页第8行中的泰勒级数展开中，为何一阶项直接==0了？

相忘江湖发表于 2019/2/20 11:31:26
- 我的数学比较差，想问一下对目标函数的求导最后一步是怎么求得？

rkz发表于 2018/7/11 21:50:33
- 你把那一步运算回去你就明白了，logf(x)求导小技巧
  
  madebyearn发表于 2019/1/14 11:10:37
github代码不全呀!

三百六十五里路发表于 2018/6/11 14:00:32
- githup上代码确实不全，但是书本上也有代码，自己组装下
  
  madebyearn发表于 2019/1/14 11:15:21
github 上的代码不全还是怎么？

Near发表于 2018/6/6 13:00:57