强化学习精要:核心算法与TensorFlow实现
  • 推荐0
  • 收藏1
  • 浏览1.6K

强化学习精要:核心算法与TensorFlow实现

冯超 (作者) 

  • 丛  书:博文视点AI系列
  • 书  号:978-7-121-34000-0
  • 出版日期:2018-04-27
  • 页  数:384
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:郑柳洁
纸质版 ¥80.00
本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。
作者用幽默的语言风格,阐述强化学习相关原理,配合TensorFlow代码实现,加深读者理解。

目录

本书勘误

印次
  • 页码:P136  •  行数:20  •  印次: 1

    self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进,只不过无伤大雅就是多输出几次info而已

    Nymrli 提交于 2018/7/11 10:58:38
    郑柳洁 确认于 2018/7/17 17:23:40
  • 页码:83  •  行数:25  •  印次: 1

    原文:
    123/456/789/b:0
    789/a:0


    应该修改为:
    123/456/789/a:0
    789/b:0

    LongXiaJun 提交于 2018/6/4 8:20:05
    郑柳洁 确认于 2018/7/17 17:26:27
  • 页码:148  •  行数:6  •  印次: 1

    原文:
    我们要降低未来回报对当期的影响

    应该修改为:
    我们要降低未来回报对当前的影响

    LongXiaJun 提交于 2018/6/5 12:34:14
    郑柳洁 确认于 2018/6/6 10:26:31
  • 页码:179  •  行数:7  •  印次: 1

    原文:
    如果由于观察信息的损失的状态,导致无模型算法存在无法被感知和经历

    应该修改为:
    如果由于观察信息的损失,导致无模型算法存在无法被感知和经历的状态

    LongXiaJun 提交于 2018/6/6 10:29:09
    郑柳洁 确认于 2018/7/17 17:27:12
  • 页码:242  •  行数:10  •  印次: 1

    原文:
    data[reward] = discount_target_reward(data[reward], vlaue)

    应该修改为:
    data[reward] = discount_target_reward(data[reward], data[vlaue])

    LongXiaJun 提交于 2018/6/17 10:34:39
    郑柳洁 确认于 2018/7/17 17:24:26

读者评论

  • 第150页第2行公式右边求和是否应该从k=0算起? 原式从k=1算起了。

    sang21发表于 2018/10/15 2:02:35
  • 能否给些 5_1.py 的例子? 试了下 python 5_1.py SpaceInvaders-v0
    ,rendering出错了。

    sang21发表于 2018/10/11 7:59:47
  • 第220页,倒数第二段,”参数mu按照范围为…”少一个负号,应该是正负1/根号N

    SYCHAN发表于 2018/10/4 14:22:04
  • p246 上面公示的第3到5行,推导时角标有误。可以如下更正(红色为修改部分):

    (公示多,越看越迷糊,自己的数学有待提高)

    csdongxian发表于 2018/7/12 22:24:38
  • 在python3中,P136-137蛇棋的代码,做两处改动:
    1.for k,v in self.ladders.items(): ====>for k,v in list(self.ladders.items()):
    2.self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进,只不过无伤大雅就是多输出几次info而已
    我把2申请勘误了/…

    Nymrli发表于 2018/7/11 10:09:58

下载资源

相关博文

  • 从俄罗斯方块,迈向强化学习大门

    从俄罗斯方块,迈向强化学习大门

    管理员账号 2018-05-16

    小编说:强化学习在机器学习中的难度不低,它需要很多方面的知识辅助,同时自身也已经形成了一个庞大的体系。本文介绍了强化学习的基本概念,帮助读者了解强化学习的目标和特点。本文选自《强化学习精要:核心算法与TensorFlow实现》。 ...

    管理员账号 2018-05-16
    672 0 0 0

同系列书

  • 深度学习之美:AI时代的数据处理与最佳实践

    张玉宏 (作者)

    深度学习是人工智能的前沿技术。本书深入浅出地介绍了深度学习的相关理论和实践,全书共分16章,采用理论和实践双主线写作方式。第1章给出深度学习的大图。第2章和第3...

     
  • TensorFlow进阶指南:基础、算法与应用

    黄鸿波 (作者)

    本书是由人工智能一线从业专家根据自己日常工作的体会与经验总结而成的,在对TensorFlow的基础知识、环境搭建、神经网络、常用技术的详细讲解当中穿插了自己实战...

     
  • 深度学习之PyTorch实战计算机视觉

    唐进民 (作者)

    计算机视觉、自然语言处理和语音识别是目前深度学习领域很热门的三大应用方向,本书旨在帮助零基础或基础较为薄弱的读者入门深度学习,达到能够独立使用深度学习知识处理计...

    ¥79.00
  • 强化学习精要:核心算法与TensorFlow实现

    冯超 (作者)

    本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。...

    ¥80.00