V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Dlad
V2EX  ›  程序员

cursor pro 额度嗖一下就用完了,本地模型特别傻,现在怎么办?买 CC 吗

  •  
  •   Dlad · 2025 年 7 月 15 日 · 5865 次点击
    这是一个创建于 184 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我看了下 cursor 后台调用,很多近 200 万 tokens 的请求,有点烧不起:P 要是能本地部署 claude 就好了。

    43 条回复    2025-08-10 23:12:01 +08:00
    humbass
        1
    humbass  
       2025 年 7 月 15 日 via Android
    本地部署一台聪明的,100 万起跳
    mooyo
        2
    mooyo  
       2025 年 7 月 15 日
    cc 或者 GitHub copilot 吧
    Dlad
        3
    Dlad  
    OP
       2025 年 7 月 15 日
    @humbass 美好愿望罢了。
    确实强,拖了好多年的项目,嗖嗖嗖就搞定了。
    慢慢发展,生成慢点儿也行。
    Dlad
        4
    Dlad  
    OP
       2025 年 7 月 15 日
    @mooyo
    cc 这个额度,也是快速用完。
    主要是会话不能场景缓存,已有项目初始化沟通每次都要消耗大量 token 。

    copilot 也有 agent 模式吗?用了多年 tab ,感觉没啥大用。
    mooyo
        5
    mooyo  
       2025 年 7 月 15 日
    @Dlad #4 有,copilot 现在一次会话算一条额度,更耐用一点
    mooyo
        6
    mooyo  
       2025 年 7 月 15 日
    @mooyo #5 但是 copilot 的 tab 贼难用
    JoeDH
        7
    JoeDH  
       2025 年 7 月 15 日
    用一下亚马逊最新出的 kiro
    Dlad
        8
    Dlad  
    OP
       2025 年 7 月 15 日
    @JoeDH 在薅了在薅了
    cdbg
        9
    cdbg  
       2025 年 7 月 15 日 via Android
    copilot 最近已经有 agent 模式了
    lneoi
        10
    lneoi  
       2025 年 7 月 15 日
    我今天也用完了,想找个编辑器能接 gemini 的,内置普通 tab 就行。
    只有 trae 能接入,但用的效果不如 cursor ,挺奇怪。
    mumbler
        11
    mumbler  
       2025 年 7 月 15 日
    18 个月后本地小模型就有现在 claude 的水平了,现在 7B ,8B 模型相当于 24 年初最顶尖的 gpt4o 的水平
    streamrx
        12
    streamrx  
       2025 年 7 月 15 日 via iPhone
    cc 现在也降额。200 的 max 每 5 小时的量起码比之前少了一半
    Dlad
        13
    Dlad  
    OP
       2025 年 7 月 15 日
    希望大家都能做显卡的时代来的再快一点。
    世界欣欣向荣,可我快挂了啊[捂脸]
    codingforfreedom
        14
    codingforfreedom  
       2025 年 7 月 15 日 via iPhone
    我的 pro 账号基本都没怎么用,上个 v2er 上个月租完这个月不续租了,继续按月租赁,base64: dGfvvJpjb2Rpbmdmb3JmcmVlZG9t
    cat
        15
    cat  
       2025 年 7 月 16 日
    玩了两天 agent 模式,消耗了 6411 万 claude-4-sonnet-thinking tokens
    现在提示我照这个频率过两天就达到限额了,但还没超,哈哈哈
    MonikaCeng
        16
    MonikaCeng  
       2025 年 7 月 16 日 via iPhone
    cc 照道理可以调出会话历史吧,看看命令行,这不是技术难点,它没道理不做这功能
    Dlad
        17
    Dlad  
    OP
       2025 年 7 月 16 日
    @MonikaCeng
    1 、最开始用 chatgpt 的时候,所谓“会话”是每次把迄今聊天记录整个丢给 AI——考虑模型对外提供推理服务,不应被用户访问“训练”,不应有记忆。
    2 、现在可能有好转即出现“短期记忆”,但保留“记忆”需要成本,不能长久保存。首次读项目需要百万 token ,每次记忆消失,都需要这么多 token 。
    3 、类似推理可以用 cursor 请求记录引证。

    不是“会话历史”功能这么简单。
    pike0002
        18
    pike0002  
       2025 年 7 月 16 日
    augment code
    micean
        19
    micean  
       2025 年 7 月 16 日
    aws 的 kiro 刚出来,试试看?
    XTTX
        20
    XTTX  
       2025 年 7 月 16 日
    我用了一个月的 Cursor ultra 。 刚开始全是用的 Opus thinking, 10 天不到就 CD 了。政策不停地改,几天后只能用 Sonnet. 换了 CC Max 200 美金的额度, 全部 Opus ,会自动提醒, 没有 CD 焦虑。 爽 yy.

    我建议如果有项目要冲,高强度可以上 100 美金的 CC 。 我认为还是且用且珍惜,Cursor 只用了大半个月从神坛迭下来,最后还是败在 token cost 上。CC 估计也会跟着涨。
    wink
        21
    wink  
       2025 年 7 月 16 日
    @XTTX 老哥 CC 咋付费的
    leaveeel
        22
    leaveeel  
       2025 年 7 月 16 日
    @lneoi vsc 不是有 gemini assist 插件吗,这个有没有用过
    XTTX
        23
    XTTX  
       2025 年 7 月 16 日
    @XTTX 我有张国外的卡
    yuan925
        24
    yuan925  
       2025 年 7 月 16 日
    如果你之前是每月 500 次请求订阅,现在按 token 计费,可以尝试写封邮件申请更改回来。
    我的已经申请回之前的 500 次请求了。
    XTTX
        25
    XTTX  
       2025 年 7 月 16 日
    @yuan925 用 Sonnet 请求只有 225 ,用 auto 才是 500. 我用一天半 CC, 体验是终于吃上细糠了。Cursor 用的 thinking, 反应慢,啰嗦。CC 一下子就弄完了, 水管粗还是强啊。Cursor 生成的那些 TOC 我根本从来不看。
    litchinn
        26
    litchinn  
       2025 年 7 月 16 日
    我现在在用,Claude code router + gemini ,gemini 创建多个项目,每个项目一个 key ,一个 key 额度满了换一个
    yuan925
        27
    yuan925  
       2025 年 7 月 16 日
    @XTTX 最新的订阅计费高级模型(比如 claude-4-sonnet)按 20$ 计量扣减的,大概是 225 左右,用完了就提示 limit ,账账单另外付费,auto 可以无限用。如果是之前计费方式,是按请求次数算,有 500 ,差别太大了。
    https://docs.cursor.com/account/pricing
    yuan925
        28
    yuan925  
       2025 年 7 月 16 日
    @XTTX CC 其实也挺慢的,不一定比 cusor 快,效果略好,不过修复小的 bug 之类的,体验比较差,cursor 反应快很多,大多数情况用 thinking 其实效果并不好。
    subpo
        29
    subpo  
       2025 年 7 月 16 日
    怎么看限额啊?我开 agent 模式感觉 token 用起来也是嗖嗖的,但是没看到哪里有限额啊
    jonsmith
        30
    jonsmith  
       2025 年 7 月 16 日 via Android
    怎么能一下子用完的,500 次够我一个月用,可能我代码量不大
    MasterofNone
        31
    MasterofNone  
       2025 年 7 月 16 日
    当然是用 claude code+kimi-k2 啦,fuclaude
    ShaunSS
        32
    ShaunSS  
       2025 年 7 月 16 日
    cursor 已卸载, 目前 claude code 配 kimi k2 api 再结合 copilot 体验良好.
    kakki
        33
    kakki  
       2025 年 7 月 16 日
    ...500 次你们是什么都问吗?我天天 996 也问不出这么多问题.月底还剩一半.
    oudioppa
        34
    oudioppa  
       2025 年 7 月 16 日
    @ShaunSS 你感觉 kimi k2 api 能媲美 Sonnet 4 了吗
    NeroKim
        35
    NeroKim  
       2025 年 7 月 16 日
    @oudioppa 太能了
    lneoi
        36
    lneoi  
       2025 年 7 月 16 日
    @leaveeel 简单的尝试过,不知道为什么反应非常慢,功能上感觉也没 ide 的上下文支持那么强。
    xmdbb
        37
    xmdbb  
       2025 年 7 月 16 日
    @kakki 让他创建 UI ,写组件....重构......
    XTTX
        38
    XTTX  
       2025 年 7 月 16 日
    @kakki https://streamable.com/trv1k3 写两个动态效果, 简单调试一下, 30-50 个就没了
    zcljy
        39
    zcljy  
       2025 年 7 月 16 日
    看了看后台 半个月用了 90 个 claude4 请求 不是 thinking 好奇限额是怎么做到的
    sampeng
        40
    sampeng  
       2025 年 7 月 16 日 via iPhone
    @Dlad 100 刀的 max ,一天肯定够用
    Dlad
        41
    Dlad  
    OP
       2025 年 7 月 16 日 via iPhone
    @sampeng
    有点麻烦。要不还是把英伟达买了,挟天子以令不服。[doge]
    ShaunSS
        42
    ShaunSS  
       2025 年 7 月 16 日
    @oudioppa 不能, 目前体感上差不多有 3.7 九成的功力.
    fFeeOps
        43
    fFeeOps  
       2025 年 8 月 10 日
    @ShaunSS 感觉走 k2 好慢啊
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1085 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 18:42 · PVG 02:42 · LAX 10:42 · JFK 13:42
    ♥ Do have faith in what you're doing.