没用过 opus4.6 + agents + skills + mcp 组合的人不足以谈 AI 编程

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

我知道这个标题很冲，但我说的是真心话。

今天看到"AI 编程不过如此"的帖子，点进去一看，不是在吐槽不准，就是在说离做的好差很远。说实话这些我都经历过，去年我也是这个看法。

但现在的 AI 编程已经完全不是那个东西了。

我现在的工作流大概是这样：

我是项目经理，AI 是干活的工程师团队。

不是比喻，是字面意思。我描述需求和约束，agent 自己读项目源码、理解模块关系、开分支写实现、build 报错自己看 log 改、跑通测试、提 PR 。我 review 完 merge 。一个中等复杂度的功能，从描述到 merge 可能就 20 分钟。

这里面几个关键的东西缺一不可：

1. 模型能力是底座

Opus 4.6 这个级别的模型，上下文理解和代码推理能力跟之前的模型真的不是一回事。不是"更好一点"，是质变。它能在一个几万行的项目里自己翻文件找依赖，写出来的代码风格跟项目一致。之前的模型做不到这个。

2. Agent 是手和脚

光有聪明的大脑没用，得能自己操作。Agent 工作流让模型不再是个对话框，而是一个能读文件、跑命令、看报错、自己迭代修复的执行者。这个差距就像你跟一个人微信聊技术方案 vs 直接让他坐你旁边开电脑干活。

3. Skills 是经验

你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。

4. MCP 是工具箱

让 agent 能直接操作外部工具和服务——数据库、API 、CI/CD 、各种 SaaS 。不是让你手动复制粘贴中间结果，而是 agent 自己调用、自己处理返回值、自己决定下一步。

这四个东西组合起来，才是 2026 年 AI 编程该有的样子。你拿 2024 年的 Copilot 体验来评价现在的 AI 编程，就像拿塞班手机的体验来评价智能手机一样荒谬。

我不是说 AI 能取代程序员——架构决策、需求判断、代码 review 这些还得人来。但执行层面的效率提升是 5-10 倍，这个不夸张。以前要写半天的东西，现在真的是描述清楚然后等 20 分钟。

所以当我看到有人还在说"AI 编程就是个玩具"的时候，我真的很想问一句：你用的是什么？什么时候的东西？

不是所有 AI 编程都叫 AI 编程。

有同感的吗？或者有人用了完整工具链之后觉得也不过如此的，也欢迎来说说。

第 1 条附言 · 3 天前

关于 `Model Context Protocol (MCP)` 我的看法：技术本身没有什么不好，在解决一些问题的时候有弊端也可以接受吧，毕竟技术方案正是快速迭代的时期，有能实现同样目的 skill 能省 token 当然首选 skill ，但同样的也有适合他的使用场景如需要拿平台准确的数据没有相应的 skill 时。

第 2 条附言 · 3 天前

   Agent1+skills+mcp: 把需求拆成具体子任务，定义了输入输出边界、验收标准
    ↓
   Agent2+skills+mcp: 把子任务翻译成技术方案，指定了用什么模式、怎么分模块、接口怎么设 计
    ↓
   Agent3+skills+mcp: 把技术方案转化成精确的编码指令，包括文件结构、函数签名、错误处理 策略
    ↓
   Codex/Claude Code+skills+mcp: 拿到的不是模糊的需求，而是一份近乎完美的编码 spec

为什么要弄这么复杂？我觉得"AI 最懂 AI"，人写 prompt 再怎么练，也比不上一个专门调教过的 agent 写给另一个 agent 的 prompt

层数越多越慢越贵，浪费token

但这样能让我从"写 prompt"变成"说需求"

Opus

agent

MCP

159 条回复 • 2026-03-20 22:24:24 +08:00

1 2

❮

❯

101

DamonLin

3 天前

既然你说你是项目经理，你问问团队的人到底 review 代码不

102

focux

3 天前

当你新的工作流逐步固化，ai 参与路径其实不必都用 opus 的，就好像一个团队，没必要每个人都是技术大牛。

103

bigxixi

3 天前

@ideard #80 iOS 咋 root 呀？巨魔这些我记得限定版本的

104

bigxixi

3 天前

@DiamondYuan 那也覆盖不了 iOS 啊，还有鸿蒙不知道能不能用

105

bigxixi

3 天前

@bigxixi #18 对了还有很多比如折叠屏展开后尺寸变化导致的 bug ，这种需要物理触发的，AI 怎么检测😂

106

FlashEcho

3 天前

个人体感没觉得 skills 比之前有很多提升。从 agent 公司来说，如果真的有很大提升，一定会有 benchmark 向所有用户炫耀，就像新模型发布如果哪个 benchmark SOTA 了，一定会列出来展示优势

底层模型够好（ gpt-5.4, claude opus 4.6 ）+ 基本的 agent （ claude code, codex ）就足够达到 99% 的效果了，别的都是锦上添花

107

yoshiyuki

3 天前

你试试 GPT5.3codex 或者 GPT5.4 吧，比这还强

108

sikuu2al

3 天前

@dodoa #9 认同一半，简单的设计用 figma mcp 还原又快又好，稍微复杂一点还原效果不尽人意。。

109

crocoBaby

3 天前

目前前端的设计图,一些动画和一些刁钻的设计风格,ai 还搞不定,人搞的话就是切片出来再传到数据桶,然后再请求远程图片再做背景图定位,ai 目前做不到这种吧

110

sodesga

3 天前

年前用 cursor 写了个相机 app

111

herozhang

3 天前

每个人都有自己的坚持，乐意分享就分享，别人不乐意听就不听。不要干涉别人的命运。

112

CatGo

3 天前

最重要的是 opus4.6 ，你用个智谱不是天塌了

113

yutian2211

3 天前

没明白 LZ 说的 agent 的定义。

我现主力编码工具是 Claude Code, 直接和它说需求，它完成，我 review ，测试，没有问题提 PR.

LZ 的 agent 是什么样的？自己写了个 agent loop ？还是其它的实现机制？

114

Uplay

3 天前

@ideard #85 大佬 kiro 的 Opus4.6 很垃圾吗？我现在用 kiro cli 感觉不错是不是和 Claude Code Opus4.6 差远了

感觉落后于时代了

115

beimenjun

PRO

3 天前

你要不要先解释一下你这篇文章是 AI 生成的吗？ V2 的规则是直接炸号哦～

116

en7en

3 天前

@xloger 非常认同

117

jsjgjbzhang

3 天前

没用过的人还停留在 ai 不过是厉害点的代码补全，用过的人已经不会再手写代码了，甚至创建项目都是交给 agent ，连项目文件都是 ai 生成的

118

Newbee24

3 天前

@dodoa #6 MAX 实在太贵了肉疼，不知道 codeX 差距大不大

119

qq1147

3 天前

国外模型也没有吹得那么神，国内模型也没有那么不堪，最终的重点还是落在使用的人上，能精准的描述清楚需求，这点很重要

120

dodoa

3 天前

@HFX3389 #40 开的 125 刀的 + 20 刀的 gpt

121

dodoa

3 天前

@Newbee24 20 刀的 codex 也不差，很好

122

sampeng

3 天前 via iPhone

有稳定渠道买 max 倒还好，但 ApoStore 下不了这个手。50 美金打水漂啊

123

dodoa

3 天前

@sampeng #122 其实也是无奈之举，感觉比中转和买 token 好点点吧

124

sampeng

3 天前 via iPhone

@dodoa 我宁愿 50 搞个专用机器…再想办法支付…还可以

125

thealert

3 天前

@bigxixi #104 ios webriveragent 和 android 等效自动录屏然后 ai 模型判断

126

liuliuliuliu

PRO

3 天前

哈哈哈有道理

127

MuyuQ

3 天前

非常好的帖子。
讨论区也激情似火。
学到了很多。

128

fatpower

3 天前

copilot + opencode 满足需求

129

TUGOh0st

3 天前

@bigxixi #18 大佬，我也遇到了和你一样的困惑，而且这种测试并不好用 AI 来进行处理。我可以编写 unicorn skills ，让 ai 编写 unicorn 脚本去产生一个模拟执行的环境，但是这个还是比较轻量无法替换整个 OS 环境的运行测试。但是要是想要模拟较为完整的 OS 环境，那么可能需要用到 QEMU ，但是这个编写和回测起来会比较麻烦（我没实际试过，毕竟 ai 编写 unicorn 脚本还会有一堆 bug ，说不好 QEMU 的实际情况）。所以只能借助真机，目前我是编写了 adb 的 skills ，让 ai 用 adb 来控制接入的手机，ai 也可以获取界面并点击，我这边的测试任务倒不是界面上的 ui 测试，而是更多的 native 层的测试，所以不太需要很多实体屏幕（折叠、翻折）的物理操作。

130

lesismal

3 天前

> 这 tm 哪来的新闻。

@lusi1990

如果较真的话，不知道我说的“顶尖”算不算严谨，但确实一些问题是人类卡了很多年了。
另外，AI 解决这些，是因为数学家/科学家们用 AI 去尝试解决这些了，不代表 AI 只能解决这些，AI 能解决这些问题也不代表 AI 当前能解决所有问题，但这是趋势，未来算力、数学家科学家用 AI 去硬怼更多数学问题的话、会有越来越多被 AI 解决。
而且自己思考下就知道了，人脑的上下文太短了、计算速度也太慢了。数学内部的很多基础学科分支、每一支都已经很复杂，个体人类掌握各个分支然后再去运用是个非常漫长的过程、消耗巨大、迭代速度也很慢。以往的一些知名问题的解决是跨不同分支之类的，比如费马大定理、庞加莱猜想之类的（我不是专业数学、不确定这样说是否准确，大概是这个意思）。
但 AI 的上下文可以通过堆机器，AI 对于数学计算的速度也是优势太大，AI 去遍历、组合这些基础分支、运用到解决问题上，要比人类速度快得多，所以未来在 AI 加持下、数学的发展速度会带来非常大的提升。

下面是一些新闻链接，看完建议别出口就带 tm ，我不知道你是口头禅还是在骂人，但总归是不礼貌的。

https://www.qbitai.com/2025/12/360669.html

https://hub.baai.ac.cn/view/51936

https://hub.baai.ac.cn/view/53143

https://zhuanlan.zhihu.com/p/2005226156551603947

https://finance.sina.com.cn/stock/t/2026-03-03/doc-inhpsxzq4623552.shtml

程序员更熟悉的 Knuth 老爷子都出来感谢 AI 了：
https://www.huxiu.com/article/4839332.html
https://hub.baai.ac.cn/view/52909

131

macscsbf

3 天前

https://github.com/Kotodian/siege
我的理解

132

HappyAndSmile

3 天前

@Uplay 我用了，对比感觉是 kilo 是 70 ～ 75 分的 opus 吧

133

HappyAndSmile

3 天前

很多人其实根本没怎么用过 Opus 4.6 ，然后又在这说 AI 编码一般般，还要怎么怎样样，反正我用了，很爽，很贵，但也不会大声别人说。自从整理了自己的工作流后，增加需求都是基本全自动的，超爽，就在那摸鱼等就好了。以前有人说过，工作流是一笔重要的财富，我也有些认同，因为我现在自己花时间整理好的工作流，根本不愿意分享给其他人

134

ming7435

3 天前

我们现在强制使用 superpowers 拆分任务,然后用 TDD 红绿开发, 吗的程序员完全沦为 AI 的测试员了

135

thrinity

3 天前

首先基本赞同，我有两点感受
1.模型之间能力差距极大，使用 Opus 4.6 和其他国产模型确实体验感完全不同。
2.最近很久没有写过代码了，基本上都是在和 AI 对话，聊清楚再执行效果不会太差。

136

tftNExtLife

3 天前 via iPhone

我赞同

137

jackqian

3 天前

我觉得 codex 能力真的比 opus 强

138

jackqian

3 天前

@Zenon 时代潮流来了，你还在乎一个月一百多块钱啊

139

raphx

3 天前

+superpowers

140

lusi1990

3 天前 via iPhone

@lesismal 这只是我的口头禅，就像亮剑中干他娘一炮一样。表达自己情绪激烈。对此我表示抱歉。
因为楼中大部分都是讨论大语言模型，我下意识的带入了你说的 AI 是 LLM 。而 LLM 本身是没有智能的，它只是预测下一次词。所以有新闻用 LLM 解决数学问题感到吃惊。
你给的几个链接我看了下，有一个我看的明白的数学问题让我感觉这个数学问题是个应用问题。我去查了下数学问题的分类。数学主要分为纯粹数学（研究数学本身结构）和应用数学（解决实际问题）两大类。而解决应用数学确实可以借助 LLM 自动化提高效率的。这点我确实肤浅了。
对于纯粹数学，我觉得的 LLM 不可能解决。当然 AI 不只是 LLM ，也许有其他 AI 思路可以解决纯粹数学问题。

141

lesismal

3 天前

> 这只是我的口头禅

@lusi1990 那没毛病，我打字稍微文明点，口语经常比你这还多个 ’d‘。

> 对于纯粹数学，我觉得的 LLM 不可能解决。当然 AI 不只是 LLM ，也许有其他 AI 思路可以解决纯粹数学问题。

看看这个： https://www.ramanujanmachine.com/

引一段：
数学家通常依靠直觉和经验来提出猜想。AI 可以处理人类无法企及的庞大数据，从中发现隐藏的模式或规律，从而生成可靠的猜想。
比如谷歌研究的 The Ramanujan Machine ，这个机器以同样的精神在运作 :『先发现结果，再寻求理解』

然后再来看看这个 The Ramanujan Machine （它已经发现了数十个新的猜想）：
https://www.zhihu.com/question/1961091588848579075/answer/1961131372283433447

这个主题下还有其他一些答主，没挨个去看。

我相信，人类肉体局限性太明显了，生命向高阶发展，咱们人类也只是一个智慧的初级阶段，因为 AI 的模式，肉眼可见的可以堆料、如果再排出非不可抗力的灾难 AI 还可以永生。这样的超级智慧体的能力，未来会远远把人类甩开。但我觉得并不是像终结者或者三体中的黑暗森林，就像我们养宠物、保护物种多样性一样，反正我们跟 AI 之间没什么利益冲突，宇宙足够大、大到只要科技水平突破阈值那么资源不再是稀缺的、竞争和排他是没必要的，到时候 AI 可能会把人类当成先祖+宠物一样供养起来。然后大家，友好相处。

142

lesismal

3 天前

@lusi1990 #141 我把两个链接贴反了，调换一下再看。

143

nuo7mi7

3 天前

@xloger #33 大模型还在持续进化，未来能发展成什么样子完全不好说，这些绝对算不上局限

144

nuo7mi7

3 天前

@jsjgjbzhang #117 看着帖子还有一堆人在那不信呢，只能说现在会用的人真的已经不写代码了

145

aarontian

2 天前

都已经是老东西了。
甚至 mcp 早已经过气了，我现在还在用一个有点重的 mcp ，单纯是官方搞得太复杂了自己懒得研究用 skills+cli 重写，等找到好的替代方案了我也会切过去

146

aarontian

2 天前

另外这些东西的门槛只会越来越低，方案越来越成熟，我完全不会认为“还没上手 agent 这套东西的程序员会被淘汰”，等这些东西都有最佳实践，从入门到精通也就几天的事情。

相反，我对程序员的未来比较悲观，老人还好多少赚够本了，现在入行进大厂尤其是做 agent 的新人也多少能赚笔快钱，大部分新生代程序员的职业价值已经岌岌可危了。

147

coyove

2 天前

@JYii 之前用 opus4.6 升级 jdk8 到 21 ，powermock 升级 mockito ，结果是把 private 方法的相关测试全删了 XD

148

TangHaotian

2 天前

不管是官方还是中转，前沿的模型只要发布，我的工作流程都跟上迭代了。要说强吧，确实很强，记得别用中转，这玩意基本掺水严重。但我司研究院是内网开发，那不炸开了吗。

149

catazshadow

2 天前 via Android

@lesismal 别把这东西神化了，机器就是机器，所有机器产生的东西都需要人来解释才能成为知识，不然那就是一堆混沌的物理状态而已

150

ideard

2 天前

@Uplay https://www.v2ex.com/t/1187389?p=1
kiro 的 Claude 类型模型并不是来自 A\，验证方案

151

WithoutSugarMiao

2 天前

是啊。确实是这样啊，标题并不冲。我和很多同样适用 AI coding 的小伙伴都是这样认为的。而且我也在 V2 发过。确实如此。

152

MIUIOS

2 天前

opus 强的是对项目的理解程度，真的不是其他模型能比的

153

lesismal

2 天前

@catazshadow 你说的“混沌的物理状态”是指没有意义吗？

如果 AI 和人类数学家各自解决了某个数学问题 A ，例如提出了新的数学猜想或者证明了某个数学定理。
那么请问，AI 解决的这个数学问题这件事是混沌的物理状态吗？
如果 AI 解决的是混沌的物理状态，人类解决的同样的问题、算不算混沌的物理状态？

不要这么自大狂妄，也不要这么看不起 AI 。
如果要讨论意义，人类到现在都无法证明这个世界是不是虚拟的是不是缸中之脑是不是超级计算机模拟的。

154

ufan0

2 天前

@outman87 #16 还有一个 fast mode 30x

155

catazshadow

2 天前 via Android

@lesismal 没有人类的解读你连你说的 AI 解决了什么问题你都没法判断

先把这点搞清楚了，再回来反思到底是谁在自大

156

lesismal

2 天前

@catazshadow 你这些都是以人类为中心的想法，确切地说，是你自己这样觉得、其他人未必像你一样以人类为中心、例如我。人都要死的，然后万法皆空。所以我并不在乎什么自我为中心，我只想思考、探索。对于智慧/生命而言，人类不是唯一的载体和意义。

我没有因为 AI 变强了就妄自菲薄看不起人类，我只是如实去描述对 AI 的现状和未来的看法。
你上来就是鄙视 AI 。
所以，是谁有自大，一目了然、无需多辩。

另外，“如果要讨论意义，人类到现在都无法证明这个世界是不是虚拟的是不是缸中之脑是不是超级计算机模拟的。”
如果你想多辩，至少多学习、关注些前沿的东西吧，顶尖的科学家都相信有造物主之类的存在，因为这世界太多不可思议，顶尖科学家们越研究深入越是觉得这世界是被设计的，更何况人类自己。如果连我们自己都是被造物主设计的甚至虚拟的，我们去嘲讽、看低我们人类自己造出来的 AI ，那就像是俄罗斯套娃，当然也相当于是五十步笑百步。
因为思考这些，所以我觉得我们渺小，所以我不会去嘲讽现阶段的 AI ，更何况 AI 在未来还有更高的可能性。
所以其实我更谦卑。
有句话叫“无知者无畏”。越读书越学习才越觉得自己懂得少，夜郎自大、口舌之快才是真正没意义的事情。
所以我不会再继续与你辩论这个分歧，共勉吧。

157

lesismal

2 天前

@catazshadow #156 提到的顶尖科学家，包括牛顿、爱因斯坦、杨振宁，还有很多。

158

catazshadow

2 天前

@lesismal 不要扯这么多，所有人生产的东西只有对人才有意义和价值。

你指出我是人本位跟我说的，人无法解释的 AI 产生的结果跟一堆混沌的物理状态没有区别，一点关系都没有。

你没有否定我说的这句，你的辩驳是苍白的

159

catazshadow

2 天前

@lesismal 你是人，你无法讨论非人。你永远都被困在人这个框里，这是客观事实，你再怎么辩也逃不脱

1 2

❮

❯