强化学习精要:核心算法与TensorFlow实现
  • 推荐0
  • 收藏1
  • 浏览1.1K

强化学习精要:核心算法与TensorFlow实现

冯超 (作者) 

  • 丛  书:博文视点AI系列
  • 书  号:978-7-121-34000-0
  • 出版日期:2018-04-27
  • 页  数:384
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:郑柳洁
纸质版 ¥80.00
本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。
作者用幽默的语言风格,阐述强化学习相关原理,配合TensorFlow代码实现,加深读者理解。

目录

本书勘误

印次
  • 页码:P136  •  行数:20  •  印次: 1

    self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进,只不过无伤大雅就是多输出几次info而已

    Nymrli 提交于 2018/7/11 10:58:38
    郑柳洁 确认于 2018/7/17 17:23:40
  • 页码:83  •  行数:25  •  印次: 1

    原文:
    123/456/789/b:0
    789/a:0


    应该修改为:
    123/456/789/a:0
    789/b:0

    LongXiaJun 提交于 2018/6/4 8:20:05
    郑柳洁 确认于 2018/7/17 17:26:27
  • 页码:148  •  行数:6  •  印次: 1

    原文:
    我们要降低未来回报对当期的影响

    应该修改为:
    我们要降低未来回报对当前的影响

    LongXiaJun 提交于 2018/6/5 12:34:14
    郑柳洁 确认于 2018/6/6 10:26:31
  • 页码:179  •  行数:7  •  印次: 1

    原文:
    如果由于观察信息的损失的状态,导致无模型算法存在无法被感知和经历

    应该修改为:
    如果由于观察信息的损失,导致无模型算法存在无法被感知和经历的状态

    LongXiaJun 提交于 2018/6/6 10:29:09
    郑柳洁 确认于 2018/7/17 17:27:12
  • 页码:242  •  行数:10  •  印次: 1

    原文:
    data[reward] = discount_target_reward(data[reward], vlaue)

    应该修改为:
    data[reward] = discount_target_reward(data[reward], data[vlaue])

    LongXiaJun 提交于 2018/6/17 10:34:39
    郑柳洁 确认于 2018/7/17 17:24:26

读者评论

  • p246 上面公示的第3到5行,推导时角标有误。可以如下更正(红色为修改部分):

    (公示多,越看越迷糊,自己的数学有待提高)

    csdongxian发表于 2018/7/12 22:24:38
  • 在python3中,P136-137蛇棋的代码,做两处改动:
    1.for k,v in self.ladders.items(): ====>for k,v in list(self.ladders.items()):
    2.self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进,只不过无伤大雅就是多输出几次info而已
    我把2申请勘误了/…

    Nymrli发表于 2018/7/11 10:09:58
  • 您好, 我运行第七章代码 monte_carlo.py,报错如下:
    请问是什么问题呢? 谢谢!

    patriciand发表于 2018/6/15 23:28:43
  • 第20页最下面这个无法计算的。20页最下面计算

    关中野狼发表于 2018/6/7 17:38:53
  • 您好,请问下载资源里面的代码怎么只有2到7章节,后面的代码哪里可以找到呢?

    zyw发表于 2018/6/6 19:49:54
    • Baselines项目的地址为:https://github.com/openai/baselines

      郑柳洁发表于 2018/6/11 17:28:50
    • @郑柳洁 Basalines的代码不为读者做些注释么?作者也太图省事了吧

      pigggggggy发表于 2018/6/25 17:37:18

下载资源

相关博文

  • 从俄罗斯方块,迈向强化学习大门

    从俄罗斯方块,迈向强化学习大门

    管理员账号 2018-05-16

    小编说:强化学习在机器学习中的难度不低,它需要很多方面的知识辅助,同时自身也已经形成了一个庞大的体系。本文介绍了强化学习的基本概念,帮助读者了解强化学习的目标和特点。本文选自《强化学习精要:核心算法与TensorFlow实现》。 ...

    管理员账号 2018-05-16
    628 0 0 0

同系列书

  • 深度学习之美:AI时代的数据处理与最佳实践

    张玉宏 (作者)

    深度学习是人工智能的前沿技术。本书深入浅出地介绍了深度学习的相关理论和实践,全书共分16章,采用理论和实践双主线写作方式。第1章给出深度学习的大图。第2章和第3...

     
  • 深度学习之PyTorch实战计算机视觉

    唐进民 (作者)

    计算机视觉、自然语言处理和语音识别是目前深度学习领域很热门的三大应用方向,本书旨在帮助零基础或基础较为薄弱的读者入门深度学习,达到能够独立使用深度学习知识处理计...

    ¥79.00
  • 强化学习精要:核心算法与TensorFlow实现

    冯超 (作者)

    本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法,最后讲解一些前沿的强化学习方法。...

    ¥80.00