如果想在 V2EX 获得更好的推广效果,欢迎了解 PRO 会员机制:
https://www.v2ex.com/pro/about

如果你经常使用铜币置顶主题,持有 V2EX Solana Token 会在每日签到时获得额外铜币:
https://www.v2ex.com/solana
luckybilly
V2EX  ›  推广

AI 到底有没有看懂你的提示词?

  •  1
     
  •   luckybilly · Jun 30 · 740 views

    你有没有过这种经历?

    想用 AI 做点什么(比如写代码),认真地梳理完思路、写完一段提示词,发送之后只能干等。少则几十秒,多则几分钟。你不知道 AI 怎么拆解你的需求,不知道它悄悄脑补了什么前提、曲解了哪些约束。只能等它全部输出完,回头一看:坏了,跑偏了。

    前面等的那些时间全部白费。你要么清空上下文从头来,要么在多轮对话里一点点掰正它,每轮对话都是分钟级的等待。大量时间耗在纠错上,而不是做正事。思路也被打乱了,心态也崩了。

    吃过亏之后,你开始事无巨细地把边界条件、隐含逻辑全塞进提示词,试图堵死模型乱猜的空间。但写提示词的成本陡增,而且你还是没法提前知道它到底理解对了没有。问题没解决,只是换了个形式。

    Andrej Karpathy 也吐槽过

    模型代表你做出错误假设,然后就径直跑下去而不检查。它们也不会管理自己的困惑,不会寻求澄清,不会显示不一致之处,不会呈现权衡,不会适时反推,而且它们还是有点太谄媚了。

    现在行业里流行 SDD ( Spec-Driven Development ,规格驱动开发),提前写 Spec 文档明确需求边界,能减少歧义。但这套流程有个盲区:没法提前确认 AI 是不是真的读懂了,理解偏差还是要等 AI 执行完之后才暴露出来,有些甚至还需要靠你自己去检查才能发现。

    怎么办?

    开源项目 luckybilly/understand-first 就是解决这个问题的:

    强制 AI 在执行任务之前,先完整输出它对提示词的理解。不用等漫长的生成结束,你马上就能看到它接下来要做什么,有没有曲解你的意思、有没有擅自加戏。发现偏差立刻纠正,不用事后返工。

    效果是这样的:

    demo.png

    demo 2

    欢迎试用,觉得不错的话 star 🌟 支持一下哦~

    开源地址:https://github.com/luckybilly/understand-first

    支持 ClaudeCode 、Codex 、Cursor 、KimiCode 、WorkBuddy... 等国内外各种 Agent (把链接贴给你的 Agent 让 AI 自己给你安装即可).

    Supplement 1  ·  23h 12m ago

    刚刚有个典型的例子:

    本来项目里面默认README.md 及配套的 CLAUDE.md 是英文的,中文需要切换一下才能看到。 我想让 AI 给我互换一下,但我给的提示词较为模糊,所以它理解只改 CLAUDE.md ,我打断了它,修改提示词再让它重新执行。

    image.png

    9 replies    2026-06-30 16:34:38 +08:00
    TimePPT
        1
    TimePPT  
    PRO
       Jun 30 via Android   ❤️ 1
    @Livid 推广
    lichdkimba
        2
    lichdkimba  
       23h 50m ago
    这和 plan mode 相比有什么优势?
    bush911
        3
    bush911  
       23h 42m ago via Android
    看不懂它就不是好 AI
    8888888888
        4
    8888888888  
       23h 35m ago
    这不是套娃吗
    nicaiwss
        5
    nicaiwss  
       23h 30m ago via iPhone
    这种简单的功能一般官方都有实现,比如 plan 模式
    luckybilly
        6
    luckybilly  
    OP
       23h 12m ago
    @lichdkimba 可以看作是轻量版的 plan 模式,但 plan 模式我们一般是在有较大的工作要做之前才进入 plan 来制定计划。 这个库是每次都让 AI 将它的理解展示出来,我们平时写的提示词一般没有那么严谨,AI 容易理解不完整。
    skuuhui
        7
    skuuhui  
       22h 44m ago
    首先,transformer 大模型没有懂不懂的概念,即便他完整输出了对提示词的理解,他做的时候也不一定按照前面自己说的话的去做并且能带来注意力上的问题。
    其次,你不要把它拟人,而是要把你自己的语言拟 AI 。不转变这样的思想,其他的所有东西都是画蛇添足。
    再者,你的这个场景,我个人常用的解决方案是先和 seesion1 (这一步不考研模型编码能力,考验的是知识库,项目记忆,代码阅读,连网搜索的能力)进行共创(你一言我一语),知道我觉得设计的差不多了,让他形成文档。开个 session2 ,让他按照文档去 coding 。但这个本质上解决的不是它所谓的“理不理解你“的问题,而是你知不知道你想干什么的问题。
    r6cb
        8
    r6cb  
       22h 3m ago
    你这和让 ai 先写一份 spec 有区别吗
    luckybilly
        9
    luckybilly  
    OP
       21h 42m ago
    @skuuhui 有大的任务,先用制定实施计划再让新 session 根据计划去执行,这没什么问题,是 SDD 推荐的做法,但你每件事都、每一轮对话这么折腾开多个 session 不嫌麻烦吗?

    按你说的 session2 中出现问题需要调整,最简单的方式不是在 session2 里追问更能高效解决吗?除非问题比较大,否则为什么要再去开 session3 来单聊。

    这个工具并不是替代计划的,只是个 **轻量级** 的意图对齐,能提前感知,避免执行的结果不是你真正想要的,用这个工具后能及时打断,不至于浪费时间再去一轮轮纠正,我补充的那个例子就是个比较典型的场景。你总不会是什么都先让 AI 输出计划再做吧,一些简单的任务不是直接对话去执行最高效吗?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5734 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 56ms · UTC 06:16 · PVG 14:16 · LAX 23:16 · JFK 02:16
    ♥ Do have faith in what you're doing.