数据科学家节选(2)

高扬

2017-06-26 发表于 2017-06-26 10:42 数据科学家

【节选自即将由电子工业出版社出版的《数据科学家养成手册》第二章】

科学之科

  在中国古汉语体系中多为单字词,所以大家想想也能猜得出“科学”一词其实并非中国所发明。
  的确,“科学”是个舶来的词汇。“科学”一词由明治维新时期日本学界初用于对译英文中的“Science”,由日本启蒙思想家西周(にしあまね,1829年~1897年)进行翻译引入的(科学——かがく),欧洲语言中该词来源于拉丁文“Scientia”,意为“知识”、“学问”,在近代侧重关于自然的学问。
                  
  科,会意字:“从禾从斗,斗者量也”,所以“科学”一词取义就是“测量的学问”这样一个含义。这里说到的“测量的学问”本身就有一种精确性的含义,尤其是能上升为学问的范畴,那就是带有比较严格的推敲的色彩,而经得住推敲的东西通常体系性比较完整,能够相互支撑自圆其说,这就是科学这个词的字面含义了。
  科学是一种泛指的领域,数据科学、计算机科学、社会科学、经济科学、语言科学、生物科学等等,这些各领域的科学各自有各自的体系和规范以及认知特性。这些都是小的,窄而深的认知领域。科学,不管是某个领域的科学,还是泛指的科学认知体系,都有最基本的要求——那就是精确性和体系性,即便在突破性上的特点不明显也必须保证其精确性和体系性的存在和可靠。

边界的迷茫

  人类在不断认知世界的过程中成长起来,随着科学水平的进步,观测手段的强化,工具水平的发展,人们把眼镜、耳朵、手脚都做了极大程度的“延伸”。
  人的肉眼在晴好的天气情况下可以在海平面上看到距离20到30千米的船只(视船只大小),在高山顶上可以看到超过距离300千米的城市建筑轮廓。在使用望远镜的情况下,远处的物体通常可以放大8倍到10倍,这样看20千米外的物体就像观察距离2千米的物体一样。图为在贵州省兴建的500米口径球面射电望远镜(FAST)。
           
  而在使用这种大型射电望远镜可以观测超过130亿光年以外的星体。不过也有人说这种观测方式的被动性比较强,与其说是“看”不如说是“听”。这种观测距离上的提升是极大的,从20千米的距离提升到130亿光年,大约提升6.15×1013倍。
  在人类不断扩展自己视界的边界中,不断认识到有新的星体,新的星系存在,也不断发掘到有新的天文现象,并逐步推翻旧有的天文学知识概念,建立新的天文学知识概念。在任何一个历史时期,人类既无法说清现在所掌握的知识有哪些局限性,也无法预测未来会有什么新的发现可以补充现有的知识,这就是人类认知边界扩展中一直困扰着人类的事情。
  不仅是望远技术的提升带给我们不断的新的发现与知识颠覆,对不同电磁波长的感知也让人类在认知体系上有了质的飞跃。
          
  人们最初只能凭借肉眼看到可见光部分的电磁波,也就是波长在380nm到780nm范围内的电磁波,其它波长的电磁波人类仅凭借肉眼是看不到的。波长从大到小粗略分就是我们平时说的“红橙黄绿青蓝紫”这七色光。波长比红色可见光还要大的称为红外线,红外线是在1800年由英国天文学家、古典作曲家、音乐家弗里德里希·威廉·赫歇尔(Friedrich Wilhelm Herschel,1738年11月~1822年8月)通过棱镜分光发现的。
                 
  其后,由于物体的红外辐射现象,人类又发明出了很多应用性很强的工业品,比如夜视仪。
         
  而红外线的在医学上也有非常好的临床效果,在红外线区域中,对人体最有益的波段就是4微米到14微米(4000nm到14000nm)这个波段范围,这个在医术界里面统称为“生育光线”,因为这个红外线波段对生命的生长有这促进的作用,这个红外线对活化细胞组织,血液循环有很好的作用,能够提高人的免疫力,加强人体的新陈代谢。家用医疗中也有很多形形色色的红外治疗仪,大多都是利用这种性质。
  波长比紫色可见光还要小的电磁波叫做紫外线。紫外线指的是电磁波谱中波长从 10nm到400nm 辐射的总称。1801 年德国物理学家、化学家里特(Johann Wilhelm Ritter,1776年~1810年)发现在日光光谱的紫端外侧一段能够使含有溴化银的照相底片感光,从而发现了紫外线的存在。
  随着观测技术水平的发展,波长更大的微波、无线电波、长波;以及波长更小的X射线和伽马射线也逐渐被发现。
  从人类在可见光的认知范围内不断徘徊,到近代二十世纪三十年代后发现超长波(波长1m到10的7次方m)存在的这个漫长的探索过程中,没有人能预测下一步或者什么时间在什么情况下我们能发现新的波长形式的电磁波的存在。即便我们可以去猜测可能会有某种波长的电磁波存在的情况下我,我们通常不能预言观测的具体条件、时间和地点。这种对科学未来的无法预知性不仅仅是在光学这一个小小的领域,在物理学的其他领域,以及化学,地理学,天文学,数学等这些领域我们同样有着边界扩展中的迷茫,甚至很多时候让我们方向难辨。
  美国前国防部长唐纳德·亨利·拉姆斯菲尔德 (Donald Henry Rumsfeld,1932年7月~)在他出版的回忆录《已知与未知》中写过这么一段堪称绕口令的话:“据我们所知,有‘已知的已知’,有些事,我们知道我们知道;我们也知道,有 ‘已知的未知’,也就是说,有些事,我们现在知道我们不知道。但是,同样存在‘未知的未知’——有些事,我们不知道我们不知道。”
  这段话应该说,本意不是来说明认知科学中的迷茫的,但是放在这里却有了异曲同工的效果——确实,我们在对客观世界认知的过程中会时常伴随这种“已知的已知”,“已知的未知”,“未知的已知”和“未知的未知”。这让我们头痛不已,但是同时也让我们对不断开拓认知边界中产生的乐趣充满了无穷的期待。

读者评论

相关博文

  • 九章算术

    九章算术

    高扬 2017-06-12

    本文节选自即将由电子工业出版社出版的《数据科学家养成手册》第三章 中国最早的数学专著是《周髀算经》——原名《周髀》,是算经十书之一。它们是汉、唐一千多年间来民间数学研究方面的专业著作,也曾经一度作为隋唐时代国子监算学科的教科书。 ...

    高扬 2017-06-12
    1589 0 0 0
  • 游戏AI小试牛刀(2)

    游戏AI小试牛刀(2)

    高扬 2017-06-05

    上次我们说到用深度学习来做斗地主游戏AI的一个实验项目,这次我们来说说技术实现层面的一些问题。 对于这样一个应用场景来说,我们是可以把它当做类似于图片分类的场景去做的。玩家的手牌、牌池里的牌、上下家打出的牌,这些都可以向量化成为用...

    高扬 2017-06-05
    658 1 0 0
  • 数据科学:以信息为载体的精确体系

    数据科学:以信息为载体的精确体系

    管理员账号 2017-05-25

    小编说:数据科学存在于生产和生活的各个方面,贯穿于人类社会发展的始终。数据科学作为科学,首先应该满足科学的基本定义。在此基础上,数据科学兼具数据本身的一些特性。本文内容整理自《数据科学家养成手册》认知篇 数据科学是一个巨大而抽象的...

    管理员账号 2017-05-25
    547 0 0 0