强化学习精要:核心算法与TensorFlow实现
  • 推荐5
  • 收藏11
  • 浏览7.9K

强化学习精要:核心算法与TensorFlow实现

冯超 (作者) 

  • 丛  书:博文视点AI系列
  • 书  号:978-7-121-34000-0
  • 出版日期:2018-04-27
  • 页  数:384
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:郑柳洁
电子书 ¥50.00
购买电子书
纸质版 ¥80.00
本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。
作者用幽默的语言风格,阐述强化学习相关原理,配合TensorFlow代码实现,加深读者理解。

目录

本书勘误

印次
  • 页码:P136  •  行数:20  •  印次: 1

    self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进,只不过无伤大雅就是多输出几次info而已

    Nymrli 提交于 2018/7/11 10:58:38
    郑柳洁 确认于 2018/7/17 17:23:40
  • 页码:83  •  行数:25  •  印次: 1

    原文:
    123/456/789/b:0
    789/a:0


    应该修改为:
    123/456/789/a:0
    789/b:0

    LongXiaJun 提交于 2018/6/4 8:20:05
    郑柳洁 确认于 2018/7/17 17:26:27
  • 页码:148  •  行数:6  •  印次: 1

    原文:
    我们要降低未来回报对当期的影响

    应该修改为:
    我们要降低未来回报对当前的影响

    LongXiaJun 提交于 2018/6/5 12:34:14
    郑柳洁 确认于 2018/6/6 10:26:31
  • 页码:179  •  行数:7  •  印次: 1

    原文:
    如果由于观察信息的损失的状态,导致无模型算法存在无法被感知和经历

    应该修改为:
    如果由于观察信息的损失,导致无模型算法存在无法被感知和经历的状态

    LongXiaJun 提交于 2018/6/6 10:29:09
    郑柳洁 确认于 2018/7/17 17:27:12
  • 页码:242  •  行数:10  •  印次: 1

    原文:
    data[reward] = discount_target_reward(data[reward], vlaue)

    应该修改为:
    data[reward] = discount_target_reward(data[reward], data[vlaue])

    LongXiaJun 提交于 2018/6/17 10:34:39
    郑柳洁 确认于 2018/7/17 17:24:26

读者评论

  • 您好,请问第7章之后的代码资源在哪下载?

    panpan发表于 2020/12/1 9:08:11
    • 您下到了么?书中提到的baselines项目又是什么

      gyn_1033_bit发表于 2021/2/24 14:38:57
  • A2C 算法的疑问:

    最后一个全连接层,基于之前的理解一般是给出一个行动的概率,类似一个分类问题。那么如何同时给出价值的呢?为什么经过一个全连接的计算会有两个不同的输出值?

    xiazhi8259发表于 2019/10/22 21:36:39
  • 219页内容有错啊。
    或者说和原始论文《noisy networks for exploration》中说的都不一样。原论文中是对噪声epsilon作分解(论文中说是为了减少生成随机数的开销),该处是对sigma作分解,说是为了较少参数数量从而减少计算开销。

    superzhangmch发表于 2019/3/6 19:16:20
  • 第150页第2行公式右边求和是否应该从k=0算起? 原式从k=1算起了。

    sang21发表于 2018/10/15 2:02:35
  • 能否给些 5_1.py 的例子? 试了下 python 5_1.py SpaceInvaders-v0
    ,rendering出错了。

    sang21发表于 2018/10/11 7:59:47

下载资源

电子书版本

  • Epub

相关博文

  • 从俄罗斯方块,迈向强化学习大门

    从俄罗斯方块,迈向强化学习大门

    管理员账号 2018-05-16

    小编说:强化学习在机器学习中的难度不低,它需要很多方面的知识辅助,同时自身也已经形成了一个庞大的体系。本文介绍了强化学习的基本概念,帮助读者了解强化学习的目标和特点。本文选自《强化学习精要:核心算法与TensorFlow实现》。 ...

    管理员账号 2018-05-16
    1448 0 1 0

同系列书

  • 深度学习之美:AI时代的数据处理与最佳实践

    张玉宏 (作者)

    深度学习是人工智能的前沿技术。本书深入浅出地介绍了深度学习的相关理论和实践,全书共分16章,采用理论和实践双主线写作方式。第1章给出深度学习的大图。第2章和第3...

    ¥79.00
  • 强化学习精要:核心算法与TensorFlow实现

    冯超 (作者)

    本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。...

    ¥50.00
  • 深度学习之PyTorch实战计算机视觉

    唐进民 (作者)

    计算机视觉、自然语言处理和语音识别是目前深度学习领域很热门的三大应用方向,本书旨在帮助零基础或基础较为薄弱的读者入门深度学习,达到能够独立使用深度学习知识处理计...

    ¥49.00
  • TensorFlow进阶指南:基础、算法与应用

    黄鸿波 (作者)

    本书是由人工智能一线从业专家根据自己日常工作的体会与经验总结而成的,在对TensorFlow的基础知识、环境搭建、神经网络、常用技术的详细讲解当中穿插了自己实战...

    ¥69.00

相关图书

AI魔法绘画:用Stable Diffusion挑战无限可能

陈然 (作者)

本书以实际操作为导向,详细讲解基于Stable Diffusion进行AI绘画的完整学习路线,包括绘画技巧、图片生成、提示词编写、ControlNet插件、模型...

 

一本书读懂ChatGPT

魏进锋 (作者)

本书以通俗易懂的语言对ChatGPT进行全面讲解。 本书分为10章。 第1章对ChatGPT及ChatGPT的创造者OpenAI进行初步讲解。 第2章讲解...

 

可解释人工智能导论

杨强 范力欣 朱军 陈一昕 张拳石 朱松纯 陶大程 崔鹏 周少华 刘琦 黄萱菁 张永锋 (作者)

本书全面介绍可解释人工智能的基础知识、理论方法和行业应用。全书分为三部分,共11 章。第一部分为第1 章,揭示基于数据驱动的人工智能系统决策机制,提出一种基于人...

 

隐私计算

陈凯 杨强 (作者)

在大数据和人工智能时代,如何在享受新技术带来的便利性的同时保护自己的隐私,是一个重要的问题。本书系统讲解了隐私计算的基础技术和实践案例,全书共有11 章,按层次...

 

知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案

吴睿 (作者)

认知的高度决定了你创造价值的高度,包括你对世界的认知及世界对你的认知。知识图谱与认知智能技术的发展,既孕育了圈层变更的机会,也带来了人、机器、企业如何协同与博弈...

 

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00