对话上千位AI专家:我看见了风暴

博文小编

2023-07-19

本文作者谭婧:《我看见了风暴:人工智能基建革命》一书作者,科技和科普题材作者,“亲爱的数据”公众号创始人。香港浸会大学硕士,曾负责中国节能集团控股企业战略管理,多年管理咨询经验,曾加入AI人脸识别创业公司创始团队。观察者网特约作者,虎嗅认证作者,36kr特邀作者。

我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。

《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。

一方面文章在AI、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。

一时间,我变成了一个朋友圈截图收集器,哇,好开心。

我看到很多知名人士的转发记录,以及知名人士的群聊记录。

虽未结识,但久仰大名矣。

随后不久,一位叫谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。

IDEA 研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。谭老师实在水平有限。

虽然这篇文章登上了知乎的周热点,但是评论区翻车了。好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。哇,这真是一个好建议,我怎么没有想到。

言归正传,难能可贵的专家的“批量”转发与部分知乎网友的“尖酸”评价,冰火之别说明了什么?

很有可能说明“吃瓜“群众对于AI系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。

话说回来,世界顶级大型计算机系统令顶尖架构师和开发者头疼,难道写这故事的人就不头疼了吗?做难事必有所得,头疼显然是值得的。因为这篇文章,很多知名专家来加微信,和我聊天。一些之前四年写稿攒下的专家资源也愿意把我推荐给“顶尖专家”。求之不得,感激不尽。一个月后,也就是2021年3 月,我在杭州阿里巴巴,见到了一位叫杨红霞的顶级AI专家。

看见名字里的“红”字不要怀疑,没错,女科学家。那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。那次,我们聊的是一款叫作M6 的AI大模型。那天,我们也畅谈了当时最火的AI大模型GPT-3。GPT-3 在2020年6 月10 日发布,给中国玩家的触动很大。

更直白些,中国AI科学家有压力。

阿里巴巴的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。她说起话来,爽爽快快,普通话极为流利标准。她告诉我:“我实话跟你说,为什么会回国?”她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景,她说:“我最喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”

当天的独家专访的主要内容有以下几点。

  • 第一,如今的深度学习模型已经不能满足我们的更多要求了。说白了,可能这个算法模型刚出现的时候只能满足一些特别低的要求,慢慢地,我们会越来越接近通用AI,要求的高度肯定越来越高。

  • 第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑AI的下一个阶段的技术和产品上,可以做到世界领先。

  • 第三,其他技术细节。可以看出,阿里巴巴很早就认得清下一代AI的价值,他们也很早出发了。

谈话的最后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。

夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代AI的浪潮当中,中国到底哪些技术可以作为世界第一?

在与杨红霞博士面谈之后,我又和几位技术大佬聊过。贾扬清(原阿里巴巴技术副总裁)、林伟(原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人)、曹政(原阿里云基础设施事业群资深技术专家),他们分别代表不同的三层:框架、平台和云基础设施。再算上杨红霞的模型算法团队。一个AI大模型汇集了如此多的大佬。可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。所以,才会有M6 大模型的问世。这基本上是制造大模型的标准打法,多个团队“共建”一个模型。

我前后与多位AI顶级从业者长达几十小时的促膝长聊之后,清楚地理解,想做出AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。大模型团队是由几支分别擅长不同领域(AI算力、AI框架和AI平台)的技术团队合力而成。因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。

我们聊回ChatGPT 这类AI大模型。这么重要的特大工程,底层能不重要吗?需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为、腾讯、百度,皆如此。底层软件的重要性无须多言,这里面有很多“置之死地,方可后生”的故事。我很激动地见证了AI软件的故事“讲述”到今天,也期待中国软件能够走在“长期主义”的大道上。

回到ChatGTP,AI算力、AI框架、AI平台、AI算法模型合力创造了AI大模型的成功。

某AI大佬曾谈到:“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力、计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算,等等,在国际上,大家的能力拉平,大同小异,更多是在强调怎样用好这些资源。”

在基建扎实的基础上,ChatGPT 这个“庞然大物”横空出世。AI新基建的范畴在变大。一开始,GPT 系列大模型不是基建。2023年,GPT-4 大模型已经是新基建的一部分了。在ChatGPT 引领的这一产品架构下,应用和底层大模型的联动十分紧密。

也就是说,大模型也是基建。

今天看来,AI大模型可以被看作是电,我们要有自己的发电厂。

接下来,无论是大玩意儿,还是小玩意儿,我们把大模型的应用玩起来,耍起来,发展起来。某种意义上,AI大模型的奇点已过,通用AI的火花闪烁。

国内有多个团队争夺大模型的高地。万一追不上怎么办?那很有可能,一家独大,大家全挂。

换句话说,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?这样的话,可能很大一堆产业只能最多成为依附在巨头API 上的服务商。这可太糟了。好消息是,先进技术领先的时间窗口非常短暂。坏消息是,“赢家”的布局超级迅猛。

这也反映出他们自知领先时间并不是那么多,也有很强的危机感。

中国AI大模型创业者们在焦虑中临机制变。昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。

在这六年里,我跟踪过许多微妙线索,与超过千余位从业者进行了谈话,有些人只和我简单说了两句;有些人则让谈话进行了数年。

有机会见证历史一刻,可真激动。衷心感谢大家拨冗与我交流。

“保持联系。”我在微信对话框里写道。

限时五折,快快抢购吧!

读者评论

相关专题

相关博文

  • 用GPU进行TensorFlow计算加速

    用GPU进行TensorFlow计算加速

    管理员账号 2018-03-01

    小编说:将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。为了加速训练过程,本文将介绍如何如何在TensorFlow中使用单个GPU进行计算加速,也将介绍生成TensorFlow会话(tf.Sessio...

    管理员账号 2018-03-01
    5188 0 3 1
  • AI 大战高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”

    AI 大战高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”

    博文小编 2023-06-12

    2023 年高考作文题目火热出炉,其中全国甲卷作文题引人深思: 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。 身处技术圈的我们,对于这句话可能有很多话想说。而对于这个话题,CSDN 也想问问近来大火的 AI 技术本...

    博文小编 2023-06-12
    285 0 0 0
  • 提示工程七巧板:让ChatGPT发挥出最佳性能

    提示工程七巧板:让ChatGPT发挥出最佳性能

    博文小编 2023-06-09

    机器有机器的作用,人有人的独特个性和价值。 正因为如此, 一方面,ChatGPT 等人工智能语言模型需要通过不断与人类的公共知识信息数据交互、汇聚,不断与人类进行对话,才能拥有越来越好的智能表现; 另一方面,作为人工智能机器...

    博文小编 2023-06-09
    61 0 0 0