② 书中032页整页都有问题 前半部分介绍读取.txt文件。后面就直接读取.csv文件。原竞赛数据应该是.txt文件,应以.txt的读取为关键,而不是直接从哪里调用.csv文件
032页底部 “ // id to word i2w = [w for i , w in enumerate(w2i.keys()) ” 计算出的i2w只保留了w2i.keys()的数据,无法实现 id to word。 应改成“i2w = dict((i,w) for w, i in iter(w2i.items()))”或其他代码。
① 从http://www.broadview.com.cn/book/6798 下载的数据存在问题。
从http://www.broadview.com.cn/book/6798 下载的数据“瑞金医院更新.zip”解压后,其路径“.\瑞金医院更新\瑞金医院\DataSets\ruijin_round1_train”中的*.ann文件不包含书中031页 “2. 实体关系标注 图 1-2-10” 的数据。
当然两者的数据都缺少一部分,不是赛事的全部数据。是否能提供赛事页面https://tianchi.aliyun.com/competition/entrance/231687/information 中的所有数据。
② 书中032页整页都有问题
前半部分介绍读取.txt文件。后面就直接读取.csv文件。原竞赛数据应该是.txt文件,应以.txt的读取为关键,而不是直接从哪里调用.csv文件
032页底部
“
// id to word
i2w = [w for i , w in enumerate(w2i.keys())
”
计算出的i2w只保留了w2i.keys()的数据,无法实现 id to word。
应改成“i2w = dict((i,w) for w, i in iter(w2i.items()))”或其他代码。
谢谢。