大家好,我是极客老墨。

今天我们不聊技术,咱们聊聊 AI 助手的未来。

早上(3月7日)刷到 36氪那条新闻 的时候,我正在用 OpenClaw 帮我整理昨天的代码笔记。标题很刺眼:“GPT-5.4 发布,OpenClaw 的能力要被替代?”

我愣了一下,然后笑了。

不是因为觉得 OpenClaw 真的会被替代,而是这种"替代论"太熟悉了。去年这个时候,大家还在讨论 Copilot 会不会让程序员失业;今年,轮到了 OpenClaw。

说实话,GPT-5.4 的发布确实让我挺激动的。不是看新闻激动,而是因为我之前在 Cursor 里体验过它。

那种体验,怎么说呢?

就是你写一个函数,它不仅能理解你想干什么,还能主动帮你重构,把那种"能跑但有点丑"的代码,改成"看起来像是精心设计的"样子。有一次我写了个数据处理脚本,逻辑有点绕,它直接给我重写成管道式处理,还附带了注释:“这样更容易测试”。

我当时盯着屏幕看了三秒钟,然后默默删掉了自己原来的代码。

这就是 GPT-5.4 的代码能力。不是简单的补全,是真的在理解你的意图,然后给出更好的方案。

但今天的重点不是这个。

让我真正思考的是另一件事:GPT-5.4 原生支持桌面操作了。

根据那篇文章,OpenAI 把 CUA(Computer Use Ability)直接整合进了模型。这意味着什么?意味着 GPT-5.4 可以直接操作你的电脑,打开浏览器、点击界面、发送邮件、安排日历——基本上就是 OpenClaw 现在做的事,但它是原生的。

相比于 5.2, OSWorld Verified 的测试成绩从 47.3% 提升到 75%,BrowseComp 从 65.8% 提升到 82.7%。

OSWorld Verified: AI 在真实操作系统环境中完成 开放式任务 的能力。 BrowseComp: AI 在 浏览器环境 中完成复杂任务的能力。

数字很枯燥,但背后的意思很清楚:OpenAI 正式入场"AI 操作电脑"这个赛道了。

这让我想起前几天和一个朋友的对话。他说:“你养虾(OpenClaw)养得挺开心,但万一 OpenAI 自己做了呢?”

我当时回他:“那得看价格。”

现在给出的价格,真的是贵!如果真要拿他来操作电脑,我不知道 token 消耗会怎么样,但肯定不会低!于是,这尼玛不是部署了一个AI助手,这是一个烧钱机器啊!

所以为什么 OpenClaw 推荐使用 MiniMax 呢?这种实实在在干事情的东西,token 能低的下去吗?普通人用,性价比才是王道。这就好比, 你可以买一辆百万级的豪华跑车,性能确实强,但日常代步、买菜接娃,一辆十几万的经济适用车反而更实用。OpenClaw + MiniMax 就是那个经济适用车,能满足90%的需求,还不会让你肉疼。

而且最重要的是——GPT-5.4 是封闭的。

这就是我想说的。

GPT-5.4 的桌面操作能力看起来确实强,但它是一个黑盒。你没法选择用 Claude、用 Gemini、用本地的 Llama,你只能用它。而且一旦 API 调用失败、一旦网络出问题、一旦 OpenAI 调整策略,你就没得选。

OpenClaw 不一样。

虽然它现在能力还不如 GPT-5.4 原生,但它是开放的。我可以随意切换模型,今天用 Claude 3.7 Sonnet,明天用 GPT-4o,后天试试 Grok。我可以把敏感数据留在本地,不用担心被送到 OpenAI 的服务器。我可以用 Ollama 跑本地模型,完全离线使用。

这种"掌控感",是 GPT-5.4 给不了的。

当然,我这不是在唱衰 GPT-5.4。恰恰相反,我觉得它的发布是一件好事。它证明了"AI 操作电脑"这个方向是对的,也给了 OpenClaw 们一个追赶的目标。

而且说实话,对于大多数普通用户来说,GPT-5.4 的原生能力可能更友好。不用配置、不用折腾、开箱即用。这没什么不好。

但对于我这种喜欢折腾的人来说,OpenClaw 依然有其存在的价值。

就像我自己组装电脑和买 Mac 的区别。Mac 很好,开箱即用,但你自己组装的机器,每一颗螺丝都是按你的需求拧上去的。那种满足感,是不一样的。

写到这儿,我突然意识到一件事。

我们这一代人挺幸运的,见证了 AI 从"聊天工具"变成"数字助手"的过程。GPT-5.4 的发布是一个里程碑,但它不是终点。OpenClaw、Claude Desktop、各种开源方案,都会继续演进。

关键是,我们要清楚自己需要什么。

是需要一个强大的、但封闭的解决方案?还是愿意牺牲一点便利性,换取更多的控制权和自由度?

这个问题没有标准答案。但至少,现在我们有了选择的权利。

最后,总结一下老墨的感悟:

  1. GPT-5.4 的代码能力确实强,但工具的选择不只是看能力,还要看生态和开放性
  2. 原生桌面操作是大趋势,未来很快会有更多的模型支持这一功能,但开放框架依然有生存空间,关键是差异化
  3. 作为开发者,保持对工具的掌控感,比追求最强性能更重要
  4. 也许我们普通人需要的,不是多么"智能"的工具,而是一个"符合自己需求"的、人人都能用得起的工具。

你用上了 GPT 5.4 吗?价格如何?欢迎评论区分享!


极客老墨,继续折腾!


相关阅读