全球震动背后!北大博士后揭秘DeepSeek核心技术内幕,新书独家解析

博文小编

2025-07-22


2025年年初,DeepSeek 成为全球人工智能(AI)领域的焦点,其DeepSeek-V3 和DeepSeek-R1 版本在行业内引发了结构性震动。
《DeepSeek核心技术揭秘》作为市面上为数不多地全面系统介绍DeepSeek技术原理的一本书,为大家深入了解DeepSeek核心技术提供了宝贵的学习资料!

我们有幸邀请到《DeepSeek核心技术揭秘》一书的作者卢菁老师做客博文视点“怎么看”栏目直播间~~
卢菁老师同时是优秀AI科技博主、北京大学博士后、原腾讯爱奇艺算法研究员、《速通机器学习》《速通深度学习数学基础》作者。
以下源自与卢菁老师的对话,带我们一起来看看为什么要了解DeepSeek核心技术、如何透过《DeepSeek核心技术揭秘》一书来深入高效学习~~

主持人:请老师分享一下为什么想要写《DeepSeek核心技术揭秘》这本书?
卢菁:大概是今年1月份的时候,DeepSeek V3版本火了,然后在春节期间,DeepSeek-R1推理模型跟着火了,也成为春节期间的热点。其实在春节前后,我在B站上共开了4次直播,通过4个不同的技术角度来介绍DeepSeek。之前我在贵社出过两本书,正好潘老师向我约稿,同时我这边视频各方面的内容都有了,不如整理成书,更便于知识的传播,因为文字的阅读效率要比视频高。在天时地利人和的情况下,便开始了这本书的写作。当然,这本书不是由我一个人撰写的,戴志仕老师也为本书做出了非常大的贡献。

主持人:为什么要了解Deepseek的核心技术原理呢?
卢菁:其实我写这本书之前参考过一些市面上的同类书。当时市面上的相关图书选材比较单一,大部分都是教大家怎么去用DeepSeek,比如怎么在工作等场景中使用。这个写作方向跟我不是一个赛道,我偏重于面向技术类的从业人员,比如程序员、算法工程师以及大学老师等受众。此外,我也发现DeepSeek有非常多的技术亮点,我认为很多技术亮点可能会成为未来几年的技术主流。
因此,我觉得程序员或者研究者很有必要去了解里面的一些技术。
做算法研究类的读者可以看看这本书,这本书更多的是面向程序员。

主持人:因为DeepSeek开源了,很多人可能会基于它去做研发,这些人是不是也需要了解这个技术?
卢菁:对,这是很有必要的。我看过Deepseek的源码,如果缺乏深入的了解,理解源码是比较费劲的。可以通过阅读这本书来学习源码,以及在源码上进行个性化的适配和改造,我觉得这本书是能够帮助到大家的。

主持人:这本书具体可以解决读者的哪些痛点?
卢菁:这本书里其实不止包含DeepSeek的相关内容,刚出现的Llama 4、GPT的一些最新技术,都收录在了这本书中,我觉得可以把这本书当作一个技术类的前沿综述来了解(截止到3月31号的新技术)。
比如你要写论文,你可能想了解当前的前沿综述,我相信这本书也能给大家带来帮助。
比如DeepSeek用了MoE这个模型,书中不仅会讲怎么用DeepSeek,也会把MoE当前的发展水平、发展情况以及不同公司的MoE架构做一个横向对比。通过这些方法,我希望能够描摹出一幅相对宏观的图样。
阅读这本书,除了能了解DeepSeek的技术原理,小伙伴们也能学到技术生态的相关知识。

主持人:这本书还有哪些亮点或特色来帮助大家更好地学习DeepSeek的核心技术?
卢菁:除了这本书以外,我在B站也在长期做技术分享和直播,上面也有很多配套视频。
有一个系列的视频是和这本书配套的,互相有所呼应,在学习的过程中可以把视频和书结合起来,或者把书当成视频的笔记来看。这个系列视频的点击量还是很高的,在纯技术赛道上,算是有一个非常不错的成绩。

主持人:您在写这本书的过程中,最大的感悟是什么?
卢菁:我觉得它其实是综合性的提升。说几个让我印象比较深的。
第一个是,MoE的这个架构。其实MoE是一个很早的概念了,但是因为一些原因,导致它一直停留在论文上,在落地方面一直是有各种各样的问题。DeepSeek通过优化通信以及把路由平衡的各个方面做到了非常好的效果,使得MoE的落地成为了可能。
比如Llama 3出来之后,内部一直有争议,到底是用MoE还是用传统的FFN?他们争论了一年。DeepSeek出现以后,他们果断地选择了MoE,这使得现在中国的技术已经从追赶走向了引领,这是一个非常大的进步。
第二个是,FP8的混合进度训练。它最早是英伟达提出来的,去年7月份的时候,英伟达说他的卡是支持混合进度训练的,但是他们也在探索。但DeepSeek是第一个把这件事做成了的,还是很难得的。读懂DeepSeek的技术可能会让人对显卡GPU的理解比英伟达这个厂商还要深。
第三个是,DeepSeek的公司可能总共也就一百号人,其实人很少,但却能把工程各个方面做到极致。我们在研究这个技术的时候,会发现其中很多技术,比如 MoE和它的显卡通信层,是互相配合起来的,说明它在工程上可能是很多部门一起协调做出来的。在大厂上班的同学可能都有这种感触,部门之间的协同是非常困难的一件事情,但是它能够做到,就说明它的工程组织调度能力是非常强的。所以说它的成功并不是单点的突破,而是整体上的提升,这是我感触非常深的一个点。

主持人:《DeepSeek核心技术揭秘》这本书是怎么设计内容的呢?
卢菁:这本书主要是根据DeepSeek的核心技术点来设计的。比如,其中的核心技术点包括V3,首先是MoE架构,然后就是MP18混合精度训练,以及它的各种并行策略。还有MLA技术,就是天才少女罗福莉做的工作,书上也会花比较大的篇幅进行讲解,同时这本书可能有我的一些主观理解和判断。这是第一大部分。
在第二大部分中,我们会重点讲R1模型,包括它的强化学习是怎么在NLP大模型里面应用的,以及蒸馏学习是怎样应用的。我个人认为这两项技术可能会是今后训练大模型的主流。
讲完了上述每一个技术点之后,我会穿插和横向公司进行比较,比如强化学习,我会对比Llama是怎么做的,Open AI是怎么做的。
不光是讲DeepSeek本身的技术,我想更多地站在行业的视角讲清楚这件事,因为有的时候就是不识庐山真面目,只缘身在此山中。有时候过于陷进去了,反而不能看到整体,所以我也会把自己对于行业综述性的看法体现在书中,这是我大概的内容设计。

主持人:大家伙可以如何高效地利用这本书去学习DeepSeek的核心技术,您是否有阅读路径方面的建议?
卢菁:阅读路径的话,B站上已经有了配套的视频和PPT,我建议可以先看B站上的视频,然后把书当成视频的总结来阅读。因为图书毕竟是严肃的出版物,用词严谨,写的时候可能放不开,视频上会举出更多生动的例子来帮助大家理解。
大家可以先看视频,把书当成笔记。图书会体现视频里的所有核心点,内容也更加深刻,对照着视频有了大致的理解后,在阅读时会有更深入的理解。

主持人:老师最后留几句寄语或者做个总结吧。
卢菁:我是07年读博士,做人工智能到现在已经十七八年了,最近两三年,我自身感觉进入了人工智能时代。
其实人生的风口没有几次,这一次对我个人、对大家都是比较好的、比较大的一个风口,无论是做技术、做产品、做运营或者销售,都可以把握住人工智能的风口,可以让自己以后的人生变得更加丰富。时代给了我一个机遇,能够连续出版几本书,也刚好碰到了比较关注人工智能的好时代,希望大家更多地把握住时代给予的机会。

读者评论

相关博文

  • 社区使用反馈专区

    陈晓猛 2016-10-04

    尊敬的博文视点用户您好: 欢迎您访问本站,您在本站点访问过程中遇到任何问题,均可以在本页留言,我们会根据您的意见和建议,对网站进行不断的优化和改进,给您带来更好的访问体验! 同时,您被采纳的意见和建议,管理员也会赠送您相应的积分...

    陈晓猛 2016-10-04
    5781 750 3 7
  • 迎战“双12”!《Unity3D实战核心技术详解》独家预售开启!

    陈晓猛 2016-12-05

    时隔一周,让大家时刻挂念的《Unity3D实战核心技术详解》终于开放预售啦! 这本书不仅满足了很多年轻人的学习欲望,并且与实际开发相结合,能够解决工作中真实遇到的问题。预售期间优惠多多,实在不容错过! Unity 3D实战核心技术详解 ...

    陈晓猛 2016-12-05
    3483 36 0 1
  • czk 2017-07-29
    6349 28 0 1