人工智能需要一个“乌鸦图腾”

博文小编

2025-01-23


机器能思考吗?
宇宙是一台计算机吗?
计算的边界在哪里?
数学的边界呢?
无穷的本质是什么?
……
从晶体管的出现到计算机的发展不过百余年,再到如今火热的大模型,我们无法预判AI冲击的新世界是好是坏,被诸多问题搅扰,有些来自技术层面的疑惑,有些来自伦理的思考。
读《计算》最大的收获在于,对大模型的祛魅,清楚了机器智能的边界。写数学史的文本很多,但以“计算”为线索串讲数学史,直至今天的ChatGPT,视角非常独特。
横跨了人类近3000年的文明史,综合了数学、哲学、物理学、计算机科学、人工智能、复杂系统科学等多门学科,呈现出一种独特的计算主义的世界观。

本文节选自《计算》
第12章 机器能思考吗
作者:吴翰清

2017年,我去西雅图微软总部的那次会面上,朱松纯在谈及人工智能的未来时,对AI过于依赖数据标注提出一些看法。他举了小牛吃草的例子,刚出生的小牛很快就能学会自己吃草的例子,完全不像要喂很多“数据”才能具备智能。人脑的功耗仅有10到25瓦,和一只灯泡差不多,远远低于今天数据中心的能耗。因此,朱松纯认为当前的人工智能还有很大的可改进空间,比如如何在小数据下也能产生智能?

此后,朱松纯2017年11月发表了文章《浅谈人工智能:现状、任务、架构与统一》,其中提出“小数据、大任务”的智能范式。在文中,朱松纯特别提到了来自乌鸦的启示,他举了YouTube上一个关于乌鸦的视频的例子:一只生活在城市的乌鸦为了吃到坚果里的果肉,学会了使用工具。它没有像黑猩猩那样的手指,无法砸开坚果,于是通过观察城市交通,学会让马路上的汽车轧过坚果,压碎果壳,帮它取出果肉。不仅如此,乌鸦为了保证自己的安全还学会了辨别红绿灯,它会等行人可以通行、汽车停下时再飞下来取它的果肉。乌鸦的这种观察和学习能力,并没有几百万的数据标注支持,这是我们真正需要的智能,乌鸦给出一个正确的解。人工智能需要一个“乌鸦图腾”。

基于当前的大模型预训练方式,人类能储存的文本信息几乎都已被投入训练,很快能够用于训练的高质量文本语料就将枯竭,到时不得不又借助于GAN之类的方式生成新的训练数据。然而,这显然是不合理的,因为一个人穷尽一生也无法读完互联网上的所有文本,也不可能读完一个图书馆里的所有藏书。人的一生中能读完的文本是极其有限的,在我读大学的4年里,我大约读了1亿字的文本,但这比起人类的所有资料来说只是沧海一粟。可是人脑却诞生出高级智能,具有认知推理和创造力,这是当前的人工智能所不具备的。通过这个最简单的事实就可以知道,一味追求大规模数据标注再拟合模型参数,这条路是有问题的,智能算法肯定还有可以大幅改进的地方。

另一个问题是能耗和成本过高。对于大模型(LLM),现在一般采用英伟达最强劲的A100和V100型号GPU来进行训练。chatGPT大概用了285000个CPU核和10000多颗GPU,在45TB的文本上完成了训练。对于拥有1750亿个参数的GPT-3,训练一次的成本在140万美元左右,而对于更大的模型,比如2800多亿个参数的Gopher和5400多亿个参数的PaLM,预估训练成本在200万美元到1200万美元之间。这高昂的成本让AI如何可持续发展成为一个重要的问题。

同时大规模的训练和服务会带来巨大的碳排放。2023年1月,chatGPT风靡全球,每天估计有2500万人访问,那么每天要消耗将近60万度电。假设每度电8美分,那么chatGPT一天的电费就在4.7万美元左右,我们相信真实数值只会更高。在碳中和的背景下,数据中心的能耗已经成为碳排放的一个重要可优化项。人脑并不需要这么高的能耗,原因可能在于人脑神经元之间的信号传递采用的是脉冲形式,有时序和频率,并非像人工神经网络那样在不更新时就是定值。类似地,人脑的智能算法更加高级,视觉皮层中有大约四到五层用于对视觉信号做分层处理(V1-V5),卷积神经网络就是在模拟视觉皮层的激活机制。但是,现在的人工神经网络多达几百层,仍然无法完美实现人脑的能力,现在的人工智能还只是停留在对大脑皮层的一个粗糙模仿。

但是我们也无需妄自菲薄,高级动物的智能是经过漫长进化的结果。从鱼类走上陆地开始,再到人类走出非洲,这个过程花了数亿年。在进化过程中,通过自然选择,一点儿一点儿积累出了智能的结构。如此看来,人类350多年的科技积累抵不过乌鸦的大脑也理所当然的事情。

然而,机器智能的小数据、低能耗等问题依然需要解决。在对大脑结构和行为的模仿上,需要对大脑的工作原理研究得更加透彻,在智能理论上需要更有全局观,建立一个统一的框架,而在工程上也许更要打开思路。晶体管作为基本元件引领电子计算机的发展将近一个世纪,目前逐渐遇到瓶颈。反观有机物的演化过程,可将其视为一种DNA计算,DNA编码了信息,定义了蛋白质的结构,在几十亿年的演化中充分利用物理规律,在环境中自动生成了需要的蛋白质,展现出低能耗的特点。也许对生命涌现过程的研究,将启发我们建立全新的计算范式。

《计算》
第十九届文津图书奖科普类图书
以独特的计算主义世界观
写透计算的博与精、古与今、奥与美、艰与趣

计算已经成为人们生活中不可或缺的组成部分,人类社会享受了计算技术的红利得以飞速发展。可以说当今的计算机科学和产业应用的成就是人类文明有史以来所有智慧的结晶。解释、澄清和发展“计算”这一重要概念,即本书之写作目的。本书从探索数学的起源开始,细数了数学史上三次危机的来龙去脉,逐渐引出计算理论的诞生和发展,以及这些过往是如何影响当今计算机科学最前沿方向的。最后本书从哲学层面探讨了计算的边界,将其视为人类需要继续探索的未解之谜。本书横跨了人类3000年的文明史,综合了数学、哲学、物理学、计算机科学、人工智能、复杂系统科学等多门学科,呈现出一种独特的计算主义的世界观。

读者评论

相关博文

  • 社区使用反馈专区

    陈晓猛 2016-10-04

    尊敬的博文视点用户您好: 欢迎您访问本站,您在本站点访问过程中遇到任何问题,均可以在本页留言,我们会根据您的意见和建议,对网站进行不断的优化和改进,给您带来更好的访问体验! 同时,您被采纳的意见和建议,管理员也会赠送您相应的积分...

    陈晓猛 2016-10-04
    5700 747 3 7
  • 迎战“双12”!《Unity3D实战核心技术详解》独家预售开启!

    陈晓猛 2016-12-05

    时隔一周,让大家时刻挂念的《Unity3D实战核心技术详解》终于开放预售啦! 这本书不仅满足了很多年轻人的学习欲望,并且与实际开发相结合,能够解决工作中真实遇到的问题。预售期间优惠多多,实在不容错过! Unity 3D实战核心技术详解 ...

    陈晓猛 2016-12-05
    3427 36 0 1
  • czk 2017-07-29
    6277 28 0 1