V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dodoa
V2EX  ›  程序员

没用过 opus4.6 + agents + skills + mcp 组合的人不足以谈 AI 编程

  •  
  •   dodoa ·
    ripplek · 3 天前 · 15418 次点击

    我知道这个标题很冲,但我说的是真心话。

    今天看到"AI 编程不过如此"的帖子,点进去一看,不是在吐槽不准,就是在说离做的好差很远。说实话这些我都经历过,去年我也是这个看法。

    但现在的 AI 编程已经完全不是那个东西了。

    我现在的工作流大概是这样:

    我是项目经理,AI 是干活的工程师团队。

    不是比喻,是字面意思。我描述需求和约束,agent 自己读项目源码、理解模块关系、开分支写实现、build 报错自己看 log 改、跑通测试、提 PR 。我 review 完 merge 。一个中等复杂度的功能,从描述到 merge 可能就 20 分钟。

    这里面几个关键的东西缺一不可:

    1. 模型能力是底座

    Opus 4.6 这个级别的模型,上下文理解和代码推理能力跟之前的模型真的不是一回事。不是"更好一点",是质变。它能在一个几万行的项目里自己翻文件找依赖,写出来的代码风格跟项目一致。之前的模型做不到这个。

    2. Agent 是手和脚

    光有聪明的大脑没用,得能自己操作。Agent 工作流让模型不再是个对话框,而是一个能读文件、跑命令、看报错、自己迭代修复的执行者。这个差距就像你跟一个人微信聊技术方案 vs 直接让他坐你旁边开电脑干活。

    3. Skills 是经验

    你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。

    4. MCP 是工具箱

    让 agent 能直接操作外部工具和服务——数据库、API 、CI/CD 、各种 SaaS 。不是让你手动复制粘贴中间结果,而是 agent 自己调用、自己处理返回值、自己决定下一步。

    这四个东西组合起来,才是 2026 年 AI 编程该有的样子。你拿 2024 年的 Copilot 体验来评价现在的 AI 编程,就像拿塞班手机的体验来评价智能手机一样荒谬。

    我不是说 AI 能取代程序员——架构决策、需求判断、代码 review 这些还得人来。但执行层面的效率提升是 5-10 倍,这个不夸张。以前要写半天的东西,现在真的是描述清楚然后等 20 分钟。

    所以当我看到有人还在说"AI 编程就是个玩具"的时候,我真的很想问一句:你用的是什么?什么时候的东西?

    不是所有 AI 编程都叫 AI 编程。

    有同感的吗?或者有人用了完整工具链之后觉得也不过如此的,也欢迎来说说。

    第 1 条附言  ·  3 天前
    关于 `Model Context Protocol (MCP)` 我的看法:技术本身没有什么不好,在解决一些问题的时候有弊端也可以接受吧,毕竟技术方案正是快速迭代的时期,有能实现同样目的 skill 能省 token 当然首选 skill ,但同样的也有适合他的使用场景 如需要拿平台准确的数据 没有相应的 skill 时。
    第 2 条附言  ·  3 天前
       Agent1+skills+mcp: 把需求拆成具体子任务,定义了输入输出边界、验收标准
        ↓
       Agent2+skills+mcp: 把子任务翻译成技术方案,指定了用什么模式、怎么分模块、接口怎么设 计
        ↓
       Agent3+skills+mcp: 把技术方案转化成精确的编码指令,包括文件结构、函数签名、错误处理 策略
        ↓
       Codex/Claude Code+skills+mcp: 拿到的不是模糊的需求,而是一份近乎完美的编码 spec
    

    为什么要弄这么复杂?我觉得"AI 最懂 AI",人写 prompt 再怎么练,也比不上一个专门调教过的 agent 写给另一个 agent 的 prompt

    层数越多越慢越贵,浪费token

    但这样能让我从"写 prompt"变成"说需求"

    159 条回复    2026-03-20 22:24:24 +08:00
    1  2  
    DamonLin
        101
    DamonLin  
       3 天前
    既然你说你是项目经理,你问问团队的人到底 review 代码不
    focux
        102
    focux  
       3 天前   ❤️ 1
    当你新的工作流逐步固化,ai 参与路径其实不必都用 opus 的,就好像一个团队,没必要每个人都是技术大牛。
    bigxixi
        103
    bigxixi  
       3 天前
    @ideard #80 iOS 咋 root 呀?巨魔这些我记得限定版本的
    bigxixi
        104
    bigxixi  
       3 天前
    @DiamondYuan 那也覆盖不了 iOS 啊,还有鸿蒙不知道能不能用
    bigxixi
        105
    bigxixi  
       3 天前
    @bigxixi #18 对了还有很多比如折叠屏展开后尺寸变化导致的 bug ,这种需要物理触发的,AI 怎么检测😂
    FlashEcho
        106
    FlashEcho  
       3 天前
    个人体感没觉得 skills 比之前有很多提升。从 agent 公司来说,如果真的有很大提升,一定会有 benchmark 向所有用户炫耀,就像新模型发布如果哪个 benchmark SOTA 了,一定会列出来展示优势

    底层模型够好( gpt-5.4, claude opus 4.6 )+ 基本的 agent ( claude code, codex )就足够达到 99% 的效果了,别的都是锦上添花
    yoshiyuki
        107
    yoshiyuki  
       3 天前
    你试试 GPT5.3codex 或者 GPT5.4 吧,比这还强
    sikuu2al
        108
    sikuu2al  
       3 天前
    @dodoa #9 认同一半,简单的设计用 figma mcp 还原又快又好,稍微复杂一点还原效果不尽人意。。
    crocoBaby
        109
    crocoBaby  
       3 天前
    目前前端的设计图,一些动画和一些刁钻的设计风格,ai 还搞不定,人搞的话就是切片出来再传到数据桶,然后再请求远程图片再做背景图定位,ai 目前做不到这种吧
    sodesga
        110
    sodesga  
       3 天前
    年前用 cursor 写了个相机 app
    herozhang
        111
    herozhang  
       3 天前
    每个人都有自己的坚持,乐意分享就分享,别人不乐意听就不听。不要干涉别人的命运。
    CatGo
        112
    CatGo  
       3 天前
    最重要的是 opus4.6 ,你用个智谱不是天塌了
    yutian2211
        113
    yutian2211  
       3 天前
    没明白 LZ 说的 agent 的定义。

    我现主力编码工具是 Claude Code, 直接和它说需求,它完成,我 review ,测试,没有问题提 PR.

    LZ 的 agent 是什么样的?自己写了个 agent loop ?还是其它的实现机制?
    Uplay
        114
    Uplay  
       3 天前
    @ideard #85 大佬 kiro 的 Opus4.6 很垃圾吗?我现在用 kiro cli 感觉不错是不是和 Claude Code Opus4.6 差远了 感觉落后于时代了
    beimenjun
        115
    beimenjun  
    PRO
       3 天前
    你要不要先解释一下你这篇文章是 AI 生成的吗? V2 的规则是直接炸号哦~
    en7en
        116
    en7en  
       3 天前
    @xloger 非常认同
    jsjgjbzhang
        117
    jsjgjbzhang  
       3 天前   ❤️ 2
    没用过的人还停留在 ai 不过是厉害点的代码补全,用过的人已经不会再手写代码了,甚至创建项目都是交给 agent ,连项目文件都是 ai 生成的
    Newbee24
        118
    Newbee24  
       3 天前
    @dodoa #6 MAX 实在太贵了肉疼,不知道 codeX 差距大不大
    qq1147
        119
    qq1147  
       3 天前
    国外模型也没有吹得那么神,国内模型也没有那么不堪,最终的重点还是落在使用的人上,能精准的描述清楚需求,这点很重要
    dodoa
        120
    dodoa  
    OP
       3 天前
    @HFX3389 #40 开的 125 刀的 + 20 刀的 gpt
    dodoa
        121
    dodoa  
    OP
       3 天前
    @Newbee24 20 刀的 codex 也不差,很好
    sampeng
        122
    sampeng  
       3 天前 via iPhone
    有稳定渠道买 max 倒还好,但 ApoStore 下不了这个手。50 美金打水漂啊
    dodoa
        123
    dodoa  
    OP
       3 天前
    @sampeng #122 其实也是无奈之举,感觉比中转和买 token 好点点吧
    sampeng
        124
    sampeng  
       3 天前 via iPhone
    @dodoa 我宁愿 50 搞个专用机器…再想办法支付…还可以
    thealert
        125
    thealert  
       3 天前
    @bigxixi #104 ios webriveragent 和 android 等效 自动录屏然后 ai 模型判断
    liuliuliuliu
        126
    liuliuliuliu  
    PRO
       3 天前
    哈哈哈 有道理
    MuyuQ
        127
    MuyuQ  
       3 天前
    非常好的帖子。
    讨论区也激情似火。
    学到了很多。
    fatpower
        128
    fatpower  
       3 天前
    copilot + opencode 满足需求
    TUGOh0st
        129
    TUGOh0st  
       3 天前
    @bigxixi #18 大佬,我也遇到了和你一样的困惑,而且这种测试并不好用 AI 来进行处理。我可以编写 unicorn skills ,让 ai 编写 unicorn 脚本去产生一个模拟执行的环境,但是这个还是比较轻量无法替换整个 OS 环境的运行测试。但是要是想要模拟较为完整的 OS 环境,那么可能需要用到 QEMU ,但是这个编写和回测起来会比较麻烦(我没实际试过,毕竟 ai 编写 unicorn 脚本还会有一堆 bug ,说不好 QEMU 的实际情况)。所以只能借助真机,目前我是编写了 adb 的 skills ,让 ai 用 adb 来控制接入的手机,ai 也可以获取界面并点击,我这边的测试任务倒不是界面上的 ui 测试,而是更多的 native 层的测试,所以不太需要很多实体屏幕(折叠、翻折)的物理操作。
    lesismal
        130
    lesismal  
       3 天前
    > 这 tm 哪来的新闻。

    @lusi1990

    如果较真的话,不知道我说的“顶尖”算不算严谨,但确实一些问题是人类卡了很多年了。
    另外,AI 解决这些,是因为数学家/科学家们用 AI 去尝试解决这些了,不代表 AI 只能解决这些,AI 能解决这些问题也不代表 AI 当前能解决所有问题,但这是趋势,未来算力、数学家科学家用 AI 去硬怼更多数学问题的话、会有越来越多被 AI 解决。
    而且自己思考下就知道了,人脑的上下文太短了、计算速度也太慢了。数学内部的很多基础学科分支、每一支都已经很复杂,个体人类掌握各个分支然后再去运用是个非常漫长的过程、消耗巨大、迭代速度也很慢。以往的一些知名问题的解决是跨不同分支之类的,比如费马大定理、庞加莱猜想之类的(我不是专业数学、不确定这样说是否准确,大概是这个意思)。
    但 AI 的上下文可以通过堆机器,AI 对于数学计算的速度也是优势太大,AI 去遍历、组合这些基础分支、运用到解决问题上,要比人类速度快得多,所以未来在 AI 加持下、数学的发展速度会带来非常大的提升。

    下面是一些新闻链接,看完建议别出口就带 tm ,我不知道你是口头禅还是在骂人,但总归是不礼貌的。

    https://www.qbitai.com/2025/12/360669.html

    https://hub.baai.ac.cn/view/51936

    https://hub.baai.ac.cn/view/53143

    https://zhuanlan.zhihu.com/p/2005226156551603947

    https://finance.sina.com.cn/stock/t/2026-03-03/doc-inhpsxzq4623552.shtml


    程序员更熟悉的 Knuth 老爷子都出来感谢 AI 了:
    https://www.huxiu.com/article/4839332.html
    https://hub.baai.ac.cn/view/52909
    macscsbf
        131
    macscsbf  
       3 天前
    HappyAndSmile
        132
    HappyAndSmile  
       3 天前
    @Uplay 我用了,对比感觉是 kilo 是 70 ~ 75 分的 opus 吧
    HappyAndSmile
        133
    HappyAndSmile  
       3 天前
    很多人其实根本没怎么用过 Opus 4.6 ,然后又在这说 AI 编码一般般,还要怎么怎样样,反正我用了,很爽,很贵,但也不会大声别人说。自从整理了自己的工作流后,增加需求都是基本全自动的,超爽,就在那摸鱼等就好了。以前有人说过,工作流是一笔重要的财富,我也有些认同,因为我现在自己花时间整理好的工作流,根本不愿意分享给其他人
    ming7435
        134
    ming7435  
       3 天前
    我们现在强制使用 superpowers 拆分任务,然后用 TDD 红绿开发, 吗的程序员完全沦为 AI 的测试员了
    thrinity
        135
    thrinity  
       3 天前
    首先基本赞同,我有两点感受
    1.模型之间能力差距极大,使用 Opus 4.6 和其他国产模型确实体验感完全不同。
    2.最近很久没有写过代码了,基本上都是在和 AI 对话,聊清楚再执行效果不会太差。
    tftNExtLife
        136
    tftNExtLife  
       3 天前 via iPhone
    我赞同
    jackqian
        137
    jackqian  
       3 天前
    我觉得 codex 能力真的比 opus 强
    jackqian
        138
    jackqian  
       3 天前
    @Zenon 时代潮流来了,你还在乎一个月一百多块钱啊
    raphx
        139
    raphx  
       3 天前
    +superpowers
    lusi1990
        140
    lusi1990  
       3 天前 via iPhone   ❤️ 1
    @lesismal 这只是我的口头禅, 就像亮剑中干他娘一炮一样。表达自己情绪激烈。 对此我表示抱歉。
    因为楼中大部分都是讨论大语言模型,我下意识的带入了你说的 AI 是 LLM 。而 LLM 本身是没有智能的,它只是预测下一次词。 所以有新闻用 LLM 解决数学问题感到吃惊。
    你给的几个链接我看了下,有一个我看的明白的数学问题让我感觉这个数学问题是个应用问题。 我去查了下数学问题的分类。数学主要分为纯粹数学(研究数学本身结构)和应用数学(解决实际问题)两大类。 而解决应用数学确实可以借助 LLM 自动化提高效率的。 这点我确实肤浅了。
    对于 纯粹数学,我觉得的 LLM 不可能解决。当然 AI 不只是 LLM ,也许有其他 AI 思路可以解决纯粹数学问题。
    lesismal
        141
    lesismal  
       3 天前   ❤️ 1
    > 这只是我的口头禅

    @lusi1990 那没毛病,我打字稍微文明点,口语经常比你这还多个 ’d‘。

    > 对于 纯粹数学,我觉得的 LLM 不可能解决。当然 AI 不只是 LLM ,也许有其他 AI 思路可以解决纯粹数学问题。

    看看这个: https://www.ramanujanmachine.com/


    引一段:
    数学家通常依靠直觉和经验来提出猜想。AI 可以处理人类无法企及的庞大数据,从中发现隐藏的模式或规律,从而生成可靠的猜想。
    比如谷歌研究的 The Ramanujan Machine ,这个机器以同样的精神在运作 :『先发现结果,再寻求理解』

    然后再来看看这个 The Ramanujan Machine (它已经发现了数十个新的猜想):
    https://www.zhihu.com/question/1961091588848579075/answer/1961131372283433447

    这个主题下还有其他一些答主,没挨个去看。


    我相信,人类肉体局限性太明显了,生命向高阶发展,咱们人类也只是一个智慧的初级阶段,因为 AI 的模式,肉眼可见的可以堆料、如果再排出非不可抗力的灾难 AI 还可以永生。这样的超级智慧体的能力,未来会远远把人类甩开。但我觉得并不是像终结者或者三体中的黑暗森林,就像我们养宠物、保护物种多样性一样,反正我们跟 AI 之间没什么利益冲突,宇宙足够大、大到只要科技水平突破阈值那么资源不再是稀缺的、竞争和排他是没必要的,到时候 AI 可能会把人类当成先祖+宠物一样供养起来。然后大家,友好相处。
    lesismal
        142
    lesismal  
       3 天前
    @lusi1990 #141 我把两个链接贴反了,调换一下再看。
    nuo7mi7
        143
    nuo7mi7  
       3 天前
    @xloger #33 大模型还在持续进化,未来能发展成什么样子完全不好说,这些绝对算不上局限
    nuo7mi7
        144
    nuo7mi7  
       3 天前
    @jsjgjbzhang #117 看着帖子还有一堆人在那不信呢,只能说现在会用的人真的已经不写代码了
    aarontian
        145
    aarontian  
       2 天前
    都已经是老东西了。
    甚至 mcp 早已经过气了,我现在还在用一个有点重的 mcp ,单纯是官方搞得太复杂了自己懒得研究用 skills+cli 重写,等找到好的替代方案了我也会切过去
    aarontian
        146
    aarontian  
       2 天前
    另外这些东西的门槛只会越来越低,方案越来越成熟,我完全不会认为“还没上手 agent 这套东西的程序员会被淘汰”,等这些东西都有最佳实践,从入门到精通也就几天的事情。

    相反,我对程序员的未来比较悲观,老人还好多少赚够本了,现在入行进大厂尤其是做 agent 的新人也多少能赚笔快钱,大部分新生代程序员的职业价值已经岌岌可危了。
    coyove
        147
    coyove  
       2 天前
    @JYii 之前用 opus4.6 升级 jdk8 到 21 ,powermock 升级 mockito ,结果是把 private 方法的相关测试全删了 XD
    TangHaotian
        148
    TangHaotian  
       2 天前
    不管是官方还是中转,前沿的模型只要发布,我的工作流程都跟上迭代了。要说强吧,确实很强,记得别用中转,这玩意基本掺水严重。但我司研究院是内网开发,那不炸开了吗。
    catazshadow
        149
    catazshadow  
       2 天前 via Android
    @lesismal 别把这东西神化了,机器就是机器,所有机器产生的东西都需要人来解释才能成为知识,不然那就是一堆混沌的物理状态而已
    ideard
        150
    ideard  
       2 天前
    @Uplay https://www.v2ex.com/t/1187389?p=1
    kiro 的 Claude 类型模型并不是来自 A\,验证方案
    WithoutSugarMiao
        151
    WithoutSugarMiao  
       2 天前
    是啊。确实是这样啊,标题并不冲。我和很多同样适用 AI coding 的小伙伴都是这样认为的。 而且我也在 V2 发过。确实如此。
    MIUIOS
        152
    MIUIOS  
       2 天前
    opus 强的是对项目的理解程度,真的不是其他模型能比的
    lesismal
        153
    lesismal  
       2 天前
    @catazshadow 你说的“混沌的物理状态”是指没有意义吗?

    如果 AI 和人类数学家各自解决了某个数学问题 A ,例如提出了新的数学猜想或者证明了某个数学定理。
    那么请问,AI 解决的这个数学问题这件事是混沌的物理状态吗?
    如果 AI 解决的是混沌的物理状态,人类解决的同样的问题、算不算混沌的物理状态?

    不要这么自大狂妄,也不要这么看不起 AI 。
    如果要讨论意义,人类到现在都无法证明这个世界是不是虚拟的是不是缸中之脑是不是超级计算机模拟的。
    ufan0
        154
    ufan0  
       2 天前
    @outman87 #16 还有一个 fast mode 30x
    catazshadow
        155
    catazshadow  
       2 天前 via Android
    @lesismal 没有人类的解读你连你说的 AI 解决了什么问题你都没法判断

    先把这点搞清楚了,再回来反思到底是谁在自大
    lesismal
        156
    lesismal  
       2 天前
    @catazshadow 你这些都是以人类为中心的想法,确切地说,是你自己这样觉得、其他人未必像你一样以人类为中心、例如我。人都要死的,然后万法皆空。所以我并不在乎什么自我为中心,我只想思考、探索。对于智慧/生命而言,人类不是唯一的载体和意义。

    我没有因为 AI 变强了就妄自菲薄看不起人类,我只是如实去描述对 AI 的现状和未来的看法。
    你上来就是鄙视 AI 。
    所以,是谁有自大,一目了然、无需多辩。

    另外,“如果要讨论意义,人类到现在都无法证明这个世界是不是虚拟的是不是缸中之脑是不是超级计算机模拟的。”
    如果你想多辩,至少多学习、关注些前沿的东西吧,顶尖的科学家都相信有造物主之类的存在,因为这世界太多不可思议,顶尖科学家们越研究深入越是觉得这世界是被设计的,更何况人类自己。如果连我们自己都是被造物主设计的甚至虚拟的,我们去嘲讽、看低我们人类自己造出来的 AI ,那就像是俄罗斯套娃,当然也相当于是五十步笑百步。
    因为思考这些,所以我觉得我们渺小,所以我不会去嘲讽现阶段的 AI ,更何况 AI 在未来还有更高的可能性。
    所以其实我更谦卑。
    有句话叫“无知者无畏”。越读书越学习才越觉得自己懂得少,夜郎自大、口舌之快才是真正没意义的事情。
    所以我不会再继续与你辩论这个分歧,共勉吧。
    lesismal
        157
    lesismal  
       2 天前
    @catazshadow #156 提到的顶尖科学家,包括牛顿、爱因斯坦、杨振宁,还有很多。
    catazshadow
        158
    catazshadow  
       2 天前
    @lesismal 不要扯这么多,所有人生产的东西只有对人才有意义和价值。

    你指出我是人本位跟我说的,人无法解释的 AI 产生的结果跟一堆混沌的物理状态没有区别,一点关系都没有。

    你没有否定我说的这句,你的辩驳是苍白的
    catazshadow
        159
    catazshadow  
       2 天前
    @lesismal 你是人,你无法讨论非人。你永远都被困在人这个框里,这是客观事实,你再怎么辩也逃不脱
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1105 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 17:54 · PVG 01:54 · LAX 10:54 · JFK 13:54
    ♥ Do have faith in what you're doing.