页码：P136 • 行数：20 • 印次： 1

self.ladder[v] = k 到self.pos = 1 中间的print应该减少一层缩进，只不过无伤大雅就是多输出几次info而已

Nymrli 提交于 2018/7/11 10:58:38

郑柳洁确认于 2018/7/17 17:23:40

页码：83 • 行数：25 • 印次： 1

原文：
123/456/789/b:0
789/a:0

应该修改为：
123/456/789/a:0
789/b:0

LongXiaJun 提交于 2018/6/4 8:20:05

郑柳洁确认于 2018/7/17 17:26:27

页码：148 • 行数：6 • 印次： 1

原文：
我们要降低未来回报对当期的影响

应该修改为：
我们要降低未来回报对当前的影响

LongXiaJun 提交于 2018/6/5 12:34:14

郑柳洁确认于 2018/6/6 10:26:31

页码：179 • 行数：7 • 印次： 1

原文：
如果由于观察信息的损失的状态，导致无模型算法存在无法被感知和经历

应该修改为：
如果由于观察信息的损失，导致无模型算法存在无法被感知和经历的状态

LongXiaJun 提交于 2018/6/6 10:29:09

郑柳洁确认于 2018/7/17 17:27:12

页码：242 • 行数：10 • 印次： 1

原文：
data[reward] = discount_target_reward(data[reward], vlaue)

应该修改为：
data[reward] = discount_target_reward(data[reward], data[vlaue])

LongXiaJun 提交于 2018/6/17 10:34:39

郑柳洁确认于 2018/7/17 17:24:26