深入浅出强化学习:原理入门
  • 推荐3
  • 收藏9
  • 浏览4.2K

深入浅出强化学习:原理入门

郭宪 方勇纯 (作者) 

  • 书  号:978-7-121-32918-0
  • 出版日期:2018-01-01
  • 页  数:
  • 开  本:
  • 出版状态:上市销售
  • 维护人:刘皎
电子书 ¥49.00
购买电子书
纸质版 ¥79.00
本书用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。

基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,本书既适合
零基础的人员入门学习、也适合相关科研人员作为研究参考。
零起点入门掌握AlphaGo的核心强化学习算法,原理分析+编程实践。从马尔科夫决策过程的动态规划方法一直讲到最前沿的深度强化学习,思路明确、清晰易懂!深度学习必备参考书!人工智大牛深度好评!
叙述简洁、直接、清晰,值得精读!
郭宪
南开大学计算机与控制工程学院博士后。2009 年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于 2016 年 1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数 10 篇。2016 年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。

方勇纯
南开大学教授、博士生导师、计算机与控制工程学院副院长、控制科学与工程一级学科学位分委员会主席,2017年度第七届吴文俊人工智能科学技术自然科学奖一等奖获得者。分别于1996年和1999年获得浙江大学本科和硕士学位,2002年获美国克莱姆森大学博士学位,2002年至2003年在美国康乃尔大学进行博士后研究。2003年至今任教于南开大学。2013年获得国家自然科学基金杰出青年基金资助。

目录

读者评论

  • 请问第151页第8行中的泰勒级数展开中, 为何一阶项直接==0了?

    相忘江湖发表于 2019/2/20 11:31:26
  • 基于策略梯度的强化学习方法- 我的数学比较差,想问一下对目标函数的求导最后一步是怎么求得?

    rkz发表于 2018/7/11 21:50:33
    • 你把那一步运算回去你就明白了,logf(x)求导小技巧

      madebyearn发表于 2019/1/14 11:10:37
  • github代码不全呀!

    三百六十五里路发表于 2018/6/11 14:00:32
    • githup上代码确实不全,但是书本上也有代码,自己组装下

      madebyearn发表于 2019/1/14 11:15:21
  • github 上的代码不全还是怎么?

    Near发表于 2018/6/6 13:00:57

电子书版本

  • Epub

相关博文

  • 强化学习是如何解决问题的?

    强化学习是如何解决问题的?

    管理员账号 2018-01-09

    什么是强化学习算法呢,它离我们有多远?2016年和2017年最具影响力的AlphaGo大胜世界围棋冠军李世石和柯洁事件,其核心算法就用到了强化学习算法。相信很多人想了解或者转行研究强化学习算法或多或少都跟这两场赛事有联系。如今,强化学习...

    管理员账号 2018-01-09
    2167 0 1 0
  • 强化学习:DQN与Double DQN讨论

    强化学习:DQN与Double DQN讨论

    Jessica瑾妞 2018-02-02

    1 DQN方法 强化学习逐渐引起公众的注意要归功于谷歌的DeepMind公司。DeepMind公司最初是由Demis Hassabis, Shane Legg和Mustafa Suleyman于2010年创立的。创始人Hassabi...

    Jessica瑾妞 2018-02-02
    16297 0 0 0

相关图书

AI魔法绘画:用Stable Diffusion挑战无限可能

陈然 (作者)

本书以实际操作为导向,详细讲解基于Stable Diffusion进行AI绘画的完整学习路线,包括绘画技巧、图片生成、提示词编写、ControlNet插件、模型...

 

一本书读懂ChatGPT

魏进锋 (作者)

本书以通俗易懂的语言对ChatGPT进行全面讲解。 本书分为10章。 第1章对ChatGPT及ChatGPT的创造者OpenAI进行初步讲解。 第2章讲解...

 

可解释人工智能导论

杨强 范力欣 朱军 陈一昕 张拳石 朱松纯 陶大程 崔鹏 周少华 刘琦 黄萱菁 张永锋 (作者)

本书全面介绍可解释人工智能的基础知识、理论方法和行业应用。全书分为三部分,共11 章。第一部分为第1 章,揭示基于数据驱动的人工智能系统决策机制,提出一种基于人...

 

隐私计算

陈凯 杨强 (作者)

在大数据和人工智能时代,如何在享受新技术带来的便利性的同时保护自己的隐私,是一个重要的问题。本书系统讲解了隐私计算的基础技术和实践案例,全书共有11 章,按层次...

 

知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案

吴睿 (作者)

认知的高度决定了你创造价值的高度,包括你对世界的认知及世界对你的认知。知识图谱与认知智能技术的发展,既孕育了圈层变更的机会,也带来了人、机器、企业如何协同与博弈...

 

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00