2025回顾: LLM的发展和程序员的核心价值

2025年可以说是AI生产力应用的元年。两年之前,大家讨论程序员会不会被AI替代,那时候的我使用了GitHub Copilot之后,对此嗤之以鼻:AI凭空想象出一个不存在的函数,还讲得一本正经。

可是2025年以后,我的日常工作已经离不开AI,它已经可以准确理解已有代码,快速实现POC效果,短时间内遍历大量我没接触过的代码找bug和确认产品逻辑。在AI时代,基础的代码工作已经可以由AI完成得很好,对程序员来说软件工程的思想以及架构设计变得更加重要了,因为我们的角色也从“作者”变成了“审核”和“设计”。

在现在的大环境下,我们需要研究怎么利用AI提高自己的生产力。本文回顾一下2025年大模型和模型应用的最新进展。

基础语言模型

2025年1月20日,DeepSeek R1横空出世。它用更小的计算量,达到了和GPT类似的惊人效果。NVIDIA市值应声暴跌5930亿美元。

DeepSeek也让推理模型的思考让大众熟知,大模型通过“思考”来得到更准确的结果,精细的提示词对于普通用户使用来说不再是刚需。

国产的AI大模型也来到了高光时刻,尤其是开源模型已经达到了世界领先水平。根据artificialanalysis的排名,国产模型GLM-4.7、DeepSeek V3.2、Kimi K2Thinking、MiniMax-M2.1、MiMo-V2-Flash分别霸占了榜单前五名。

闭源模型方面,OpenAI不再独占鳌头。Gemini 3.0 pro的发布,证明了不依赖NVIDIA的硬件,也可以做出世界级大模型。Claude Opus在编程领域表现卓越。模型的能力不断提高,在大部分场景下模型本身的能力已经不再是瓶颈了。

微软 CEO Satya在他的snscratchpad提出一个概念:“model overhang”,他认为目前模型的能力已经足够,但是缺少匹配的软件形态来发挥它的价值。我们需要构建更复杂的系统,来通过LLM的能力,输出真正的生产力。这个“系统”的答案,就是 Agent。

Agent & Vibe coding

随着模型能力的提升,Agent已经从玩具变成了真正的生产力。用于Vibe coding的Cursor,Claude Code 和 Github Copilot,通过让大模型调用外部的工具产生交互,编写代码、执行代码、检查结果,然后进一步迭代,在2025年真的可以作为生产力工具,写出生产环境的产品。

有趣的是,计算机软件发展史的趋势是从让人感觉枯燥的命令行到大家更喜欢的图形化界面,在现在有了LLM后,命令行反而成了 LLM 的最佳武器。对于 Agent 来说,清晰、直接的命令行接口比 GUI 更容易被理解和操作。而直接理解GUI界面并操作点击的大模型目前处于新兴发展阶段。

结语

2025 年,从 DeepSeek 打破算力垄断,到 Vibe coding变成真正生产力工具,我们见证了 AI 从“炫技”走向“实用”的全过程。

作为开发者,我们不需要焦虑被AI替代。学会构建“系统”,利用AI提高生产力,才是我们在这个新时代最大的护城河。

如果文章对你有帮助,欢迎点赞或打赏(金额不限)。你的打赏将全部用于支付网站服务器费用和提高网站文章质量,谢谢支持。

版权声明:

本文由 原创,商业转载请联系作者获得授权。
非商业转载请注明作者 雅乐网 ,并附带本文链接:
https://www.yalewoo.com/2025-llm-status.html

上一篇:

下一篇:

我要评论

验证码*: 3 + 3 =