数据科学家节选(1)

高扬

2017-06-19


【节选自即将由电子工业出版社出版的《数据科学家养成手册》第一章】
什么是科学家

从我们每个人上学前班的时候,我们就开始受到各种各样的启蒙教育,哪怕是捏橡皮泥、跳皮筋、玩弹球这些最最普通最最不起眼的游艺项目,都是我们在锻炼协调性和认识世界的过程。认识世界是我们每个人终其一生一直在进行的过程,不仅如此,我们几千年来世世代代也都在不断重复这个过程,日复一日年复一年,从未停止。
不管是中国历史还是世界历史,在从古至今的各个时期或者朝代,都留下过很多故事。除了王侯将相们会留下他们的传记以外,还有两类人也会留下他们的名字,而且这些名字会被大家自发记住并且广为传颂,一类是艺术家——人类的生命因他们的提炼而升华,人类的生活因他们的演艺而更加精彩;还有一类就是科学家——是他们为人类的进步,一砖一木一石一瓦地搭建一级级坚实的台阶,他们是一群伟大的人。我们要说的就是这样一群伟大的人。
在我们印象中的科学家通常都是天资聪颖,智慧出众,在某一领域理解深刻的。科学家与我们常人都有哪些区别呢?是因为他们更聪明所以才能当科学家吗?是他们记忆力殊绝于人才能当科学家吗?是因为他们有更好的坚忍不拔的性格才能克服困难成为科学家吗?我认为这些因素都只是成就科学家的一部分因素,而且既不是充分条件也不是必要条件。
作为一个有知识和有一定文化程度的常人来说,其实很多技术很多科学原理我们都能理解而且加以应用,而且不乏有些人会应用得非常纯熟,但是众多的常人中却很少有能够被称为科学家的。原因何在呢?

1.1 从东升西落开始

1.1.1 农历

太阳东升西落,一年四季夏热冬冷,这种信息叫常识,即便没有任何人来总结这些规律告诉我们,在一个人的生命周期里每天每月每年都在体验着这种交替,我们常人都可以得到这样的结论。这不足为奇,当然更不可能让每个人都因为对这种常识的总结或感知而成为科学家。
人们现代使用的历法——公历、农历,是有着完整的时间标识,日期标识,四季节气标识,并可以进行换算,时间加减,误差补偿的完整的历法体系,非常准确与精妙。中国人古代习惯使用的农历也叫阴历(这种叫法其实并不严谨,应该叫阴阳历)、夏历,是从夏朝甚至更早以前就被人总结出来一直使用至今的。中间历朝历代都在为这个历法体系的健全进行修订,我们现在所用的农历历法体系大部分都是来自于在西汉太初年间进行修订的版本也就是太初历,所以叫做汉历更合适。
年月日换算的规则大致规则是这样,太阳东升西落算一日,月亮完整的一次盈亏周期29.53059天算一个月(朔望月)。地球公转和黄赤交角变化产生的春夏秋冬轮回的一年平均长度为365.2422日。它们之间大约是12倍的关系,不过这样算一下12个朔望月和一个回归年的差距有10.87512天——这个差距可不算小。
如果直接以12个朔望月作为一年的话,这样的结果在多年叠加后会让人感觉很滑稽,因为如果假设一年农历的正月初一和公历的1月1日在同一天,第二年公历1月1日的时候,农历已经是1月11日了;第十年公历1月1日的时候,农历已经是4月18日了,再往后就越差得多。历法在很大程度上是为了对时间周期进行描述并指导农耕等生产行为的,这种误差会让每个月对应的天气情况和由于地球公转的太阳年产生的真实情况有着非常大的差别,如果要进行几月播种几月收割这种知识的传授,几乎都要加一个“时间漂移”条件才能使用。并且每隔33.5851年用朔望月12个月为定年标准的历法就要比太阳年整整差出一年去,无论如何这种历法体系到这里设计都显得非常不健全。还好先人们想出了“闰月”这个办法来进行误差补偿。
29.5306i+29.530612y=365.2422y
根据刚刚我们得到的条件,我们现在要求i和y的取值,意义就是说在y个太阳年中加入i个闰月是能够把误差补齐的。这样算出来,我们可以得到一组相对精确的数值:
y=19, i=7
带进去算一下,会得到误差为0.0892天,即在19个农历年中加入7个闰月这样基本能够调平12个朔望月所形成的一年和一个太阳年之间的大部分差值,还剩下一个0.0892天的误差,约合2.1408小时。刚刚说的这种方法就是农历中提到的“十九年七闰月法”。

在二十四节气中的冬至是一个非常重要的节气。冬至是用圭表进行观测标出的,这一天太阳直射南回归线。现在置闰的方法是两个冬至之间,如仅有12个朔望月则不置闰,若有13个朔望月即置闰。置闰的月从冬至开始,当出现第一个没有中气的月份,这个月就是闰月,其名称是在前个月的前面加一个“闰”字,例如八月后需要置润,那么八月后的这个月不叫九月而叫做闰八月,闰八月之后才是九月。

有趣的是,农历中的正月、二月、三月……冬月、腊月,这些月是按照朔望月来进行计算和标注的。但是,二十四节气却是根据对太阳运行的周期规律的观测来进行标注和计算的,进而对农历做了补充历法,要不怎么说农历是阴阳历呢。所以每一年的农历月和节气之间就会像和公历之间那样产生“错位”,因而产生农历月中会有“不太规律”的缺中气的月出现。不管是哪个月,反正是从冬至开始计算,第一个没有中气的月就做一次闰月。二十四节气最早被全数记录是在《淮南子·天文训》中,当然其中也包括关于“十九闰七”的天文现象论述。

二十四节气在中国民间已经扎根了几千年,我们依赖它进行农耕,甚至依赖它进行基于中医药理论的人体调理,依照节气进行相应的补泻,据说效果尤佳。这对于“民以食为天”的中国人来说格外地亲切,也不乏中国的民间艺术家们用充满灵性的画笔对这种古朴的文化热情地演绎。

大家来看,从一个“太阳东升西落,一年四季夏热冬冷”做出发点就能归纳出这么大一套完整的由太阳、地球、月球天体运行所产生现象的周期性规律总结,并能将它用于指导农业生产,不能不说是一项非常重要并且有深远意义的科学体系。当然和“太阳东升西落,一年四季夏热冬冷”的知识相比,完整的农历就是科学的——虽然我们已经不知道最开始发现他的科学家是谁了,我猜想这也不会是一个人的成就,而是千百年来一代一代热爱智慧的人们通过不断观察、总结、实践、补充而逐渐形成的越来越完整的理论体系,这是一个平凡而伟大的工程。

读者评论

相关博文

  • 九章算术

    九章算术

    高扬 2017-06-12

    本文节选自即将由电子工业出版社出版的《数据科学家养成手册》第三章 中国最早的数学专著是《周髀算经》——原名《周髀》,是算经十书之一。它们是汉、唐一千多年间来民间数学研究方面的专业著作,也曾经一度作为隋唐时代国子监算学科的教科书。 ...

    高扬 2017-06-12
    1588 0 0 0
  • 游戏AI小试牛刀(2)

    游戏AI小试牛刀(2)

    高扬 2017-06-05

    上次我们说到用深度学习来做斗地主游戏AI的一个实验项目,这次我们来说说技术实现层面的一些问题。 对于这样一个应用场景来说,我们是可以把它当做类似于图片分类的场景去做的。玩家的手牌、牌池里的牌、上下家打出的牌,这些都可以向量化成为用...

    高扬 2017-06-05
    658 1 0 0
  • 数据科学:以信息为载体的精确体系

    数据科学:以信息为载体的精确体系

    管理员账号 2017-05-25

    小编说:数据科学存在于生产和生活的各个方面,贯穿于人类社会发展的始终。数据科学作为科学,首先应该满足科学的基本定义。在此基础上,数据科学兼具数据本身的一些特性。本文内容整理自《数据科学家养成手册》认知篇 数据科学是一个巨大而抽象的...

    管理员账号 2017-05-25
    543 0 0 0