对话上千位AI专家：我看见了风暴

本文作者谭婧：《我看见了风暴：人工智能基建革命》一书作者，科技和科普题材作者，“亲爱的数据”公众号创始人。香港浸会大学硕士，曾负责中国节能集团控股企业战略管理，多年管理咨询经验，曾加入AI人脸识别创业公司创始团队。观察者网特约作者，虎嗅认证作者，36kr特邀作者。

我和AI大模型的缘分，要从2021年元宵节发布的一篇1.4万字的稿子谈起。

《搞深度学习框架的那帮人，不是疯子，就是骗子》这篇稿子发布后，遭遇了冰火两重天，号称见不多识不广的谭老师我，直接傻眼了。

一方面文章在AI、计算机领域百余位专家的朋友圈疯传，我的微信那几天是爆炸状态。

一时间，我变成了一个朋友圈截图收集器，哇，好开心。

我看到很多知名人士的转发记录，以及知名人士的群聊记录。

虽未结识，但久仰大名矣。

随后不久，一位叫谢育涛的专家致电我，他告诉我，沈向洋老师想让他代为转达，问我愿不愿意加入IDEA，主要工作是写稿。

IDEA 研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。谭老师实在水平有限。

虽然这篇文章登上了知乎的周热点，但是评论区翻车了。好一片挖苦讽刺谩骂嘲讽之声。我当时心想，一个人一定是干了什么丧尽天良的事，才配获此“殊荣”。甚至有人说，你不配写科技，你一个女的为什么不去写情感专栏。哇，这真是一个好建议，我怎么没有想到。

言归正传，难能可贵的专家的“批量”转发与部分知乎网友的“尖酸”评价，冰火之别说明了什么？

很有可能说明“吃瓜“群众对于AI系统的认知和真正的专家相比，其分裂程度可能比东非大裂谷还大。

话说回来，世界顶级大型计算机系统令顶尖架构师和开发者头疼，难道写这故事的人就不头疼了吗？做难事必有所得，头疼显然是值得的。因为这篇文章，很多知名专家来加微信，和我聊天。一些之前四年写稿攒下的专家资源也愿意把我推荐给“顶尖专家”。求之不得，感激不尽。一个月后，也就是2021年3 月，我在杭州阿里巴巴，见到了一位叫杨红霞的顶级AI专家。

看见名字里的“红”字不要怀疑，没错，女科学家。那是一个春光明媚的晴天，湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰，像跳动的钢琴键。远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。杨红霞博士朝我招手，我顺着半圆形的斜坡步行而上，也向她挥手回应。春草茵茵，行李箱轱辘哗哗作响。那次，我们聊的是一款叫作M6 的AI大模型。那天，我们也畅谈了当时最火的AI大模型GPT-3。GPT-3 在2020年6 月10 日发布，给中国玩家的触动很大。

更直白些，中国AI科学家有压力。

阿里巴巴的会议室多得像森林里的树木，终于坐下，一张桌子，两杯咖啡。杨红霞博士扎着利落的马尾，额前干净，没有刘海，少量碎发。她说起话来，爽爽快快，普通话极为流利标准。她告诉我：“我实话跟你说，为什么会回国？”她的答案真好，连标点符号里都流露出温柔的真诚与强烈的技术愿景，她说：“我最喜欢的技术是从复杂的业务里抽象出来，用技术去解决实际问题。我不喜欢走反过来的路，假如走反过来的路，我可以选择去研究型的高校。所有人都要有一些耐心，没有耐心，永远只有单点的结果，很难去实现线和面。”

当天的独家专访的主要内容有以下几点。

第一，如今的深度学习模型已经不能满足我们的更多要求了。说白了，可能这个算法模型刚出现的时候只能满足一些特别低的要求，慢慢地，我们会越来越接近通用AI，要求的高度肯定越来越高。
第二，阿里巴巴希望在一些很重要的核心方向上，尤其是在支撑AI的下一个阶段的技术和产品上，可以做到世界领先。
第三，其他技术细节。可以看出，阿里巴巴很早就认得清下一代AI的价值，他们也很早出发了。

谈话的最后，杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤，挺好吃的。

夜幕降临淘宝城，我明白了中国的AI科学家们在思考：在下一代AI的浪潮当中，中国到底哪些技术可以作为世界第一？

在与杨红霞博士面谈之后，我又和几位技术大佬聊过。贾扬清（原阿里巴巴技术副总裁）、林伟（原微软硅谷研究院研究员，阿里云机器学习PAI平台负责人）、曹政（原阿里云基础设施事业群资深技术专家），他们分别代表不同的三层：框架、平台和云基础设施。再算上杨红霞的模型算法团队。一个AI大模型汇集了如此多的大佬。可以看出，对于AI大模型，阿里投入的是整建制的团队，调动的不只是达摩院的力量。所以，才会有M6 大模型的问世。这基本上是制造大模型的标准打法，多个团队“共建”一个模型。

我前后与多位AI顶级从业者长达几十小时的促膝长聊之后，清楚地理解，想做出AI大模型（那时候还没有ChatGPT），仅靠一支算法团队远远不够。大模型团队是由几支分别擅长不同领域（AI算力、AI框架和AI平台）的技术团队合力而成。因为一些外力，我和杨红霞博士的故事就在这里戛然而止了，那次采访没有出稿。2023年春节前后，我得知杨红霞博士已经去了今日头条。此后，所有人问起我关于她离职的消息，我都三缄其口。

我们聊回ChatGPT 这类AI大模型。这么重要的特大工程，底层能不重要吗？需要解释一下，在互联网大厂，底层是共用的。阿里巴巴如此，华为、腾讯、百度，皆如此。底层软件的重要性无须多言，这里面有很多“置之死地，方可后生”的故事。我很激动地见证了AI软件的故事“讲述”到今天，也期待中国软件能够走在“长期主义”的大道上。

回到ChatGTP，AI算力、AI框架、AI平台、AI算法模型合力创造了AI大模型的成功。

某AI大佬曾谈到：“观察硬件和算力平台，如果没有某国的捣乱，整体而言，我们的硬件计算能力、计算量，以及就是说我们的一些底层的核心技术，比如说像高性能网络、高性能存储、异构计算，等等，在国际上，大家的能力拉平，大同小异，更多是在强调怎样用好这些资源。”

在基建扎实的基础上，ChatGPT 这个“庞然大物”横空出世。AI新基建的范畴在变大。一开始，GPT 系列大模型不是基建。2023年，GPT-4 大模型已经是新基建的一部分了。在ChatGPT 引领的这一产品架构下，应用和底层大模型的联动十分紧密。

也就是说，大模型也是基建。

今天看来，AI大模型可以被看作是电，我们要有自己的发电厂。

接下来，无论是大玩意儿，还是小玩意儿，我们把大模型的应用玩起来，耍起来，发展起来。某种意义上，AI大模型的奇点已过，通用AI的火花闪烁。

国内有多个团队争夺大模型的高地。万一追不上怎么办？那很有可能，一家独大，大家全挂。

换句话说，假如美国OpenAI公司和微软公司赢家通吃，这里的赢家只有一家（一对），那会发生什么样的事情？这样的话，可能很大一堆产业只能最多成为依附在巨头API 上的服务商。这可太糟了。好消息是，先进技术领先的时间窗口非常短暂。坏消息是，“赢家”的布局超级迅猛。

这也反映出他们自知领先时间并不是那么多，也有很强的危机感。

中国AI大模型创业者们在焦虑中临机制变。昔日我笔下的“骗子”已不知去向，而“疯子”在太阳升起的地方，沐浴着金色而悠远的晨光，再次出发，留给地平线崭新的背影。

在这六年里，我跟踪过许多微妙线索，与超过千余位从业者进行了谈话，有些人只和我简单说了两句；有些人则让谈话进行了数年。

有机会见证历史一刻，可真激动。衷心感谢大家拨冗与我交流。

“保持联系。”我在微信对话框里写道。

限时五折，快快抢购吧！

图书分类

高可靠系统构建指南：服务稳定性建设与技术债务治理

特色专题

帮助

对话上千位AI专家：我看见了风暴

博文小编

读者评论

相关专题

相关博文

用GPU进行TensorFlow计算加速

AI 大战高考作文！实测 ChatGPT、文心一言、通义千问等 8 款“神器”

提示工程七巧板：让ChatGPT发挥出最佳性能