大语言模型当道,我们还要不要学机器学习

博文小编

2025-04-16

王海华 博文视点Broadview
“某某大语言模型又出新版本了!”“大语言模型又刷新了某项纪录”“AI已经可以在某某方面替代90%的人工了”…
每天看新闻,必有对大语言模型的热议,我们普通人看这些AI的表现,就跟看奥运会哪个运动员又打破了某项纪录一样“看热闹”。
确实,进入 2022 年之后,从 OpenAI 的 ChatGPT,到 Google 的 Gemini,再到国内的文心一言、DeepSeek 等等,大模型的能力惊艳世界。从代码生成、文案写作,到数据分析和语言翻译,它们几乎无所不能。
输入一句话,它便能完成你写报告、编代码、答题,甚至绘图、作曲、制作视频。
在强大的力量面前,我们“弱小 ”“无助”,甚至想要放弃:既然大模型都能帮我完成任务了,那我还学什么编程?学什么机器学习?
现在还有必要学“机器学习”么?
类似的问题还有很多,对于我而言,这关系到我的数学建模和数据分析课要讲哪些内容,精简到什么程度。
我这两天在思考这个问题:,本文是对我思考的一些整理。
一、大模型之强,离不开机器学习
大语言模型的确很强,而且正变得越来越强。它们之所以厉害,背后是大量机器学习技术的积累和突破:基于 Transformer 结构的深度神经网络能够处理超长文本序列,大规模无监督预训练让模型具备了丰富的常识知识,指令微调(Instruction Tuning)与人类反馈优化(RLHF)让模型更加“听话”,多模态融合则让文字、图像、音频乃至视频能够相互“看得懂”。
可以说,今天的大模型是过去二十年机器学习技术逐步积累、爆发的集大成者。
然而,正因为如此,我们才不能“因果倒置”:正是因为机器学习,我们才有了大模型;而不是因为有了大模型,机器学习就不重要了。
二、大模型是“通用”,机器学习是“定制”
大语言模型往往需要大量数据来训练,而且在一些特定领域或者极其专业的场景下,未必有足够的“高质量训练语料” 让大模型实现完美表现。
我感触很深的一点是:当我们面对数据较小或结构性很强的项目需求时,传统的机器学习方法(比如决策树、SVM、随机森林等)以及精心设计的特征工程,依旧具有高效且稳定的优势。
另外在很多工业场景或科研任务中,如果我们的目标更侧重于可解释性、鲁棒性或资源受限(算力、存储空间)的条件,那么相对“轻量化”的传统机器学习方法就会显得不可替代。这时候,机器学习的“定制能力”就显得尤为重要。
再者,掌握机器学习基本原理后,我们才能在适合的场景下自如地选择或研发新的模型,而不是仅仅把一切都交给一个体型庞大、算力消耗巨大的大模型。
三、不懂机器学习,用不好大模型
大模型很强,但并不代表可以“一招鲜,吃遍天”。如果我们不了解机器学习的底层原理、数据处理流程和评估方法,往往只能把大模型当作一个“黑盒”来使用,无法识别它的局限,甚至可能被它给出的结果误导。
例如,大模型在面对结构化数据分析或特定工业场景时,可能需要进行“提示词工程”(,或者结合领域知识对模型输出进行校正。若缺乏对数据特征、算法机理的理解,用户就难以判断哪些场合适合大模型直接应用,哪些场合更需要混合传统机器学习算法。
对大模型进行微调(Fine-tuning),或者与其他小模型做协同配合,更是需要扎实的机器学习基础:如何选取合适的数据?如何避免过拟合或训练不稳定?如何评估模型性能并不断迭代?
因此,机器学习不仅能帮我们理解大模型“为什么能”,也能帮我们发现大模型“为什么不能”,从而在实战中发挥大模型的最大价值。
四、机器学习依然是“数学 + 编程 + 思维”的极佳训练场
机器学习的学习与实践过程,本质上就是对数学基础、编程技能和问题分析思维的一次综合训练。它既需要我们掌握线性代数、概率论、统计学等数学理论,也需要具备编程实现、数据预处理、算法调参的实际动手能力,更需要在面对复杂问题时具备抽象与推理的思考方式。而这一切并不会因为大模型的出现而变得不再重要,反而显得更加紧迫和宝贵。
数学: 机器学习的各种算法与模型,都依赖扎实的数学理论来保证可解释性与稳定性。无论是线性回归的矩阵求解,还是深度学习的梯度下降原理,都离不开对数学的理解。会用大模型只是“能走路”,懂数学才能“看清路”。
编程: 机器学习中对数据处理、模型搭建、训练与部署的各个环节,都需要编程来实现和衔接。哪怕使用大模型进行辅助开发,也得懂基础编程,才能对生成的代码进行验证、调试和改进。
数据思维: 机器学习中最核心的,是如何面对一堆原始数据或一个模糊的需求时,能够抽象出问题,并将其转化为可分析、可求解的模型。这需要我们具备把混乱的现实结构化、把直觉的想法量化,并用系统性的实验设计和评估方法来验证的能力。这个思维过程无法由大模型直接“给予”,只能通过自身学习和反复实践来培养。
对于学习者来说,机器学习或许不再需要在某些“基础实现”上投入大量时间,但它依旧是最好的“数学 + 编程 + 思维”训练场。只有把这些底层能力打牢,才能在大模型时代游刃有余地选择、改造或创造新工具,而非被工具所左右。
我这里推荐一本图解机器学习的书,也是这本书的阅读直接引发了我对本文的思考《StatQuest图解机器学习》。

我给大家截个图,实际上它每页都是这样的图解,推荐给机器学习初学者:

就像懂车的人开自动驾驶汽车更放心,懂机器学习的人和大模型“协作”时才能充分发挥其潜力。

读者评论

相关博文

  • 社区使用反馈专区

    陈晓猛 2016-10-04

    尊敬的博文视点用户您好: 欢迎您访问本站,您在本站点访问过程中遇到任何问题,均可以在本页留言,我们会根据您的意见和建议,对网站进行不断的优化和改进,给您带来更好的访问体验! 同时,您被采纳的意见和建议,管理员也会赠送您相应的积分...

    陈晓猛 2016-10-04
    5700 747 3 7
  • 迎战“双12”!《Unity3D实战核心技术详解》独家预售开启!

    陈晓猛 2016-12-05

    时隔一周,让大家时刻挂念的《Unity3D实战核心技术详解》终于开放预售啦! 这本书不仅满足了很多年轻人的学习欲望,并且与实际开发相结合,能够解决工作中真实遇到的问题。预售期间优惠多多,实在不容错过! Unity 3D实战核心技术详解 ...

    陈晓猛 2016-12-05
    3427 36 0 1
  • czk 2017-07-29
    6277 28 0 1