godleon
V2EX  ›  Claude

正确使用 claude 的姿势是什么?怎么能降低 Token 消耗

  •  
  •   godleon · May 4 · 5622 views
    This topic created in 33 days ago, the information mentioned may be changed or developed.

    RT

    开的 claude pro ;

    平时只用 claude opus4.7 写页面。codex 写后端;

    目前使用的姿势。

    桌面端的 desktop ,模型 opus4.7 high ,从写这个项目开始,一直都是一个对话框来对话。

    举例做个功能,让他修改一个 vue 项目,一页面增加一个按钮,点击按钮弹出对话框。 这一个功能要用掉 70%。

    1 个问题直接 limit 。

    是不是姿势不对 ~ 求大佬指点

    41 replies    2026-05-07 11:12:22 +08:00
    HFX3389
        1
    HFX3389  
       May 4
    姿势是对的,pro 的 limit 就是这么低,尤其是你还开 high ,要是你开 max 思考,功能只能做到一半
    godleon
        2
    godleon  
    OP
       May 4
    @HFX3389 主要是对页面要求高,想做的细一些,一直开的都是 high 。pro 好歹 100 多 rmb ,太夸张了。
    giter
        3
    giter  
       May 4
    20 美元对于美国人来说价格很合理,但汇率差对于中国人来说偏贵。

    如果要写大项目,开个 Max 5x 或者 Max 20x 才能完成,因为 Pro 丐版本身就不适合长久 Vibe Coding 。
    teaguexiao
        4
    teaguexiao  
       May 4
    Claude Code 用完 Pro 限额是正常的,换 API+claude.ai 组合比订阅划算多了。用 cursor max 或者直接 API 按量付费,大项目反而更省。
    xkj888418
        5
    xkj888418  
       May 4
    QAZXCDSWE
        6
    QAZXCDSWE  
       May 4
    使用官方版本,使用 Mac 端或者是 Linux 端,整体架构最高级模型,小功能组件就基础 sonet
    zhangleijuly
        7
    zhangleijuly  
       May 4
    pro 的 token 太少了只能支持设计无法支持开发,减少 token 消耗我知道一个 caveman 一个 rtk ,两个采用的是不同的思路,可以一起用
    qing18
        8
    qing18  
       May 4
    换成 Sonnet 4.6
    plasticman64
        9
    plasticman64  
       May 4
    不是你的问题,Claude 的上下文就是特别短,我觉得用 vscode+claude code 插件消耗会小一点,你都试试
    runningowl
        10
    runningowl  
       May 4
    一个功能一个 plan ,第一个会话做 plan ,然后每一步都可以开个新会话引用这个 plan ,记得做完一步就更新 plan 和功能文档
    runningowl
        11
    runningowl  
       May 4
    也可以考虑做 plan 用 opus ,执行用 sonnet
    jetsung
        12
    jetsung  
       May 4   ❤️ 2
    https://github.com/rtk-ai/rtk
    压缩命令行的工具
    s4nd
        13
    s4nd  
       May 4
    还是直接上 max 吧,pro 那点额度只能用来塞牙缝
    chchwy
        14
    chchwy  
       May 4
    不要用 Opus 。Opus 幾分鐘就能用光你的 Pro limit

    既然訂了 Pro ,就老老實實的用 Sonnet
    jacketma
        15
    jacketma  
       May 4
    @giter 老美点外卖、快递有点费,但是数码产品和服务的消费真是爽歪歪啊
    ebushicao
        16
    ebushicao  
       May 4
    用英文,中文会有很高的额外消耗。
    WhatTheBridgeSay
        17
    WhatTheBridgeSay  
       May 4
    > 从写这个项目开始,一直都是一个对话框来对话。

    那你这不废话么,从来不清空上下文,这要是没有自动压缩你一个月的配额也就够一次问答的
    940i3s34v4F1HW41
        18
    940i3s34v4F1HW41  
    PRO
       May 4
    这个能做到吗?
    stormtrooperx5
        19
    stormtrooperx5  
       May 4
    阶段性总结项目进度+接下来要做啥,重新起对话
    mooyo
        20
    mooyo  
       May 4
    显然你的 pro 不够蹬,开 claude pro 还不如开个其他的。他家的 pro 就是体验装,给你试用一下而已,哪有真的用 pro 干活的。
    tourist0007
        21
    tourist0007  
       May 4
    首先 claude code 上下文就那么多,其次现在他确实比之前要费;再者一直都一个会话,也不是完全不可以,但你要把整体的架构理清楚,最好不要一句话让他完成所有,上下文压缩时本来就会有损失,不可能一板一眼全部都存下来;最后你反过来用会不会更好?
    bf109_
        22
    bf109_  
    PRO
       May 4
    还是 codex 香啊
    viskem
        23
    viskem  
       May 4
    跟你有同样的困惑,但刚才想到一个办法,你看看合适否:
    对 OPUS 说: [每次跟你说完需求,你都先拆解为高级任务(你执行)和次级任务(给 Sonnet 执行),然后我会让你继续完成高级任务,并开启另一个 Session 选择为 Sonnet ,对它说“执行次级任务”。注意,你需要保证多个 Session 同时任务不要有任何冲突,也不要有强依赖,注意不要高估了 Sonnet 的能力。]
    xialaoban
        24
    xialaoban  
       May 4
    我喜欢一开始先生成计划和文档,然后将大任务拆分成小任务,每次完成一个或者几个小任务,由任务规划得来的设计文档、产品文档等等来保证同频协作。
    即使这样也并不完美,大模型总会因为上下文卡死,烦不胜烦
    最早这种工作方式来自于 kiro 和 roocode ,慢慢就养成了习惯

    另外 opusplan 会自动切换 2 个模型,我理解简单对话它会使用 opus 执行的时候会用 sonnet ,也算是节省方式吧
    1wlinesperday
        25
    1wlinesperday  
       May 4
    不骗你 用 opus 做 plan ,ds v4 pro 做 execute ,成本降低 10 倍
    zhhmax
        26
    zhhmax  
       May 4
    始终在一个会话里面,当然耗费 token 容易触限。

    我的用法是尽可能新开对话,避免长上下文。以及设置定时任务刷新 5 小时限制,如果触发周限了就临时用 API 顶一顶。
    godleon
        27
    godleon  
    OP
       May 4
    @WhatTheBridgeSay
    @zhhmax

    这个没影响吧,感觉跟项目代码有关,我新建窗口,让他在其中一个页面做上述操作,使用还是一样的。
    你每次打开个新对话,多麻烦,而且你这很容易跑偏啊,特别是样式。
    godleon
        28
    godleon  
    OP
       May 4
    @1wlinesperday 老哥不行啊,dsv4pro 页面写的样式写的稀碎啊
    huarong
        29
    huarong  
       May 4 via Android   ❤️ 1
    新功能,新开会话。
    上下文窗口使用超过 50%立即使用压缩。
    项目代码中,增加 docs 目录,记录每次的开发日志,当前的 todo ,项目进度。维护规则写在 agents.md
    simoonfeng
        30
    simoonfeng  
       May 5
    我的习惯是一个功能一个新对话,不会一直在一个对话上让上下文一直叠加。
    xiaket
        31
    xiaket  
       May 5
    今天早上 Anthropic 工程师给我们讲的时候给的官方推荐: https://claude.com/blog/the-advisor-strategy
    huihuilang
        32
    huihuilang  
       May 5 via Android
    好奇怪的问题,claude 不都是公司买 token 吗?我们团队一个月烧掉 2000 刀的 token
    其实也不贵,2000 刀一个程序员都招不到
    godleon
        33
    godleon  
    OP
       May 5
    @huihuilang 独立开发者
    huihuilang
        34
    huihuilang  
       May 5 via Android
    @godleon 哦 难怪了
    不过 claude 用的爽还是买 token 吧,现在就算是 max 也是缩水的厉害。。。其他家也都是
    starlion
        35
    starlion  
       May 5
    平常简单任务编程用 sonnet 够了,复杂思考可以用 opus 规划,然后编码用 sonnet
    Anekys
        36
    Anekys  
       May 5
    如果你想要好的效果,那必然少不了多 Agent 互相监督 review,但是这种行为天然就是 Token 杀手.
    如果你想省 Token 花费,就尽量在 Token 缓存的时间窗口内去工作.
    aaaak
        37
    aaaak  
       May 5
    看到有类似说 中文分词税的说法, 所以 使用英文提问问题 估计会省点 token
    Claude (特别是 Claude 3 及后续模型)在处理中文时,相比英文存在显著的“分词高消耗”现象,这被称为中文税( Chinese Tax )
    davidqw
        38
    davidqw  
       May 5
    /model opusplan
    q534
        39
    q534  
       May 5
    你把 claude 的 pro 模型看成 gpt 的 plus 模型就理解了,两边的顶级模型一个只让体验,一个直接不让用
    ddshub
        40
    ddshub  
       May 6
    可以结合 sonnet 来写 prd ,执行的时候再用 opus
    -----
    呆呆兽中转站,让国人享受折扣 Claude 模型
    https://www.ddshub.cc/home
    满血 Claude 低至 3 折
    满血 CodeX 低至 1 折
    国内直连,支持开票服务
    欢迎同行/老板交流
    aaronforvalue
        41
    aaronforvalue  
       May 7
    我搭了 3 个 hook | Claude Code 少烧了 40%token context ... http://xhslink.com/o/iqHxlRoH7v
    戳进 [小红书] 发现精彩内容!
    我昨晚刷到这个了,我觉得还不错,可以看看,是比较系统的,不是那种零散的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1078 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 119ms · UTC 18:25 · PVG 02:25 · LAX 11:25 · JFK 14:25
    ♥ Do have faith in what you're doing.