• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Exia2
V2EX  ›  程序员

Vibe Coding 不是软件工程?符合软件工程规范的 AI 软件工程平台来了。

  •  
  •   Exia2 ·
    PRO
    · 1 day ago · 2935 views

    过去半年,我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快,但随着项目规模扩大,技术债开始爆发。
    Vibe Coding 的核心问题并不在于某几行代码的质量低下,而在于它完全缺乏全局观,且不遵循软件工程的规范。
    没有宏观架构,没有项目长期记忆,没有自动化审计,我们意识到 Vibe Coding Is Not Engineering 。
    为了使 AI 编程更符合软件工程规范,我们开发了这个项目。

    AnyPal:将 Vibe Coding 带入软件工程时代

    AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台,支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时,引入了软件工程的规范。

    多 Agent 协同与对抗审计:内置工程经理,架构师等 11 个 AI 角色与 6 个反方审查员,支持 Coder 与 Adversary (测试/安全等)多 Agent 左右互搏,在代码交付前完成质量闭环。

    成本优化:对抗审计配合 S/M/L/XL 任务规模自动切换模型,可以极大降本增效,将 Token 花在刀刃上。

    项目长期记忆:基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱,设立 Postmortem 工作区,自动复盘每个 BUG ,沉淀经验随项目共同进化。

    支持敏捷迭代( Plan 模式)和对抗式编程。

    敏捷开发:看板工作区

    切换到 Plan 模式后,系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。
    和项目经理对话,将你的意图拆解为具备前后置依赖关系的树状任务流,统筹项目全局推进,多任务并行开发,不再需要打开多个 Chat 对话。
    在线/离线模式: 用户在线时主动追问对齐需求,提前确认方案。用户离线后自主推进看板任务。

    对抗式编程

    多 Agent 共享代码库与会话,正方写代码,反方实时审计,在代码进入暂存区前置阻断与纠偏,避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销,大幅提质代码产出质量,对中小模型效果尤为明显。

    实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7

    这是项目早期的一个极端测试:在完全不人工干涉的情况下,让 AI 独立使用 WebDAV 协议实现一个网盘系统。

    AnyPal 组:正方( Coder )使用 DeepSeek-V4-Flash ,反方(审查)使用 DeepSeek-V4-Pro 。

    对照组:GitHub Copilot + Opus 4.7 。

    在此案例中,资源消耗相近的情况下,AnyPal 凭借工程化闭环实现 10 倍以上的性价比。

    一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/

    UI 预览功能

    在 AI 编程的时候 UI 也是一大痛点,回滚不仅浪费 Token ,还可能影响其他组件。
    现在 AI 在开始前会先询问需求,给出数个方案和预览,您可以选择其一或者继续修改需求。

    自动复盘

    AI 修复 BUG 后自动生成 Markdown 复盘文档,记录严重程度、时间线、根因、修复措施,并关联可回放的 Agent 会话,随时追溯决策过程。该文档会进入项目的长期记忆,随项目共同进化。

    参与内测

    项目地址: https://anypal.pome.net/

    支持免登录,自行导入大模型 API 使用。

    注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。

    推荐使用客户端体验完整功能

    加入 Q 群:497719526 领取限量 Token 补贴。

    我们正在寻找视频团队和测评博主合作,如果您有意向请联系我们。

    Supplement 1  ·  21h 41m ago

    感谢 @felixcode 纠错。在对照实验中,Copilot 确实弹出了功能勾选列表,由于我们的操作失误,没有注意到 Web UI 的选项,从而直接导致 Opus 交付了无 UI 的原生目录界面。

    此次实验因我们的疏忽,未能做到客观、严谨,导致原文中“Opus 没做 UI”的结论与事实不符。在此,我们向大家真诚致歉,也感谢 @felixcode 帮我们纠正了错误。

    目前 AnyPal 刚开启内测,我们深知产品和团队都有很多不完美的地方,欢迎大家提出意见,我们会重视每个反馈。

    27 replies    2026-06-10 17:52:54 +08:00
    orcl
        1
    orcl  
       1 day ago
    看着有点牛逼
    dayuzhu
        2
    dayuzhu  
       1 day ago
    mac 没有客户端吗?
    Varvel
        3
    Varvel  
       1 day ago
    785150334 497719526 都搜不到群
    shoushen
        4
    shoushen  
       1 day ago
    感觉确实不错,建议 b 站发个视频,然后在网站首页放一下,降低用户的认知成本。
    shoushen
        5
    shoushen  
       1 day ago
    特别是讲一下每一项功能实现的技术原理和可以获得的收益、实现的效果。
    Exia2
        6
    Exia2  
    OP
    PRO
       1 day ago
    @Varvel 抱歉了,开了搜索也搜不到,不知道什么原因,http://anypal.net/网页底部有二维码
    Exia2
        7
    Exia2  
    OP
    PRO
       1 day ago
    @dayuzhu Mac 端还在走流程,预计 3 天后上线
    Branlice
        8
    Branlice  
       1 day ago
    MCN 团队,视频可以合作 ZGV2aWxlcjIwMjY=
    connor123
        9
    connor123  
       1 day ago
    专业开发者用不上,小白看不懂
    Orchestraa
        10
    Orchestraa  
       1 day ago
    推广发在对应的板块吧
    emiyamuto
        11
    emiyamuto  
       1 day ago
    我理解就是你们这个工具解决的就是 hardness 的问题,通过约束 ai 行为进行 coding
    FinnBai
        12
    FinnBai  
       1 day ago
    建议放在推广节点

    等 mac 客户端出了试一下,之前用过一个类似的,产品使用逻辑上不太好用
    xiaomushen
        13
    xiaomushen  
       1 day ago
    一看就不想用的样子。。。
    Exia2
        14
    Exia2  
    OP
    PRO
       1 day ago
    @Orchestraa 明白了 下次发推广
    Leon6868
        15
    Leon6868  
       1 day ago
    像是专门用了 mica-electron ,有心了
    sin2624
        16
    sin2624  
       23h 13m ago
    想到一块去了,一套几乎一样的东西在 Agent 自举开发中😂
    felixcode
        17
    felixcode  
    PRO
       23h 4m ago
    GitHub Copilot + Opus 4.7 里,你不提需求,就变成它没做 UI ?
    主动提供的 WEB UI 选项是被你给吃了吗?
    wbrobot
        18
    wbrobot  
       21h 16m ago
    多少? 527M ??你往里面放了个 winxp sp3 的 ISO 吗?
    azadmin
        19
    azadmin  
       20h 52m ago via Android
    @wbrobot Codex 桌面版也差不多这么大
    azadmin
        20
    azadmin  
       20h 16m ago via Android
    对接中转站貌似有点问题,模型发现失败: Cannot create property '[object Object]' on string 'codex-auto-review'
    Exia2
        21
    Exia2  
    OP
    PRO
       20h 6m ago
    @azadmin 欢迎进群反馈,开发会直接跟您沟通
    Chuckle
        22
    Chuckle  
       19h 52m ago
    界面好看,有空试试,不过学习一个新工具成本还高,现阶段专业的还是脱离不了 ide 或者 codex cc 成熟的 agent 生态,以及 vb 上绕不过去的 codex app 大山。如果给成熟的 agent 做“外围插件”,什么记忆系统之类的,难免会受限,像支持 hook 、plugin 的 agent 也没多少,更别说更深层的定制改动了,不够自由,但自己做 agent ,同质化和换工具成本高。如果只是免费注册用 api ,推广的吸引力还是不够,毕竟凹凸曼大善人,时不时来个 bug gpt5.5 就 free 了,还有一堆中转站。
    我实践时也发现 op 所言,它完全缺乏全局观,agent 本身只是个“操作系统”,在复杂老项目中,完成需求任务,更多的瓶颈不是上下文大小、agent 能力,而是上层应用,只有 agent ,AI 不知道业务架构,AI 无法从一个页面上,定位到你成百上千的仓库改哪个文件,AI 无法完成测试闭环,这背后还有需求分析、业务数字化、代码地图、质量审计的事情,以及模仿阿尔法狗进化的老路子,让 AI 自己学习经验,试错才是最宝贵的,这也是我边做需求边做 ai 工作流头疼的点。
    多 agent 弄个对抗网络的设计,之前好像也见过,但实际开发并不会像 demo 那样一段话生成***,自由度没这么高,也不是单仓库项目,往往是涉及多个仓库,多个包。
    多 agent 对抗、规范沉淀,加上需求复杂性导致不可避免的上下文压缩,感觉有让 AI 偏离原有的产品 prd 设计方向的风险。
    另外对比图也过于夸张了,opus4.7 不至于,一句话生成***不仅听腻了,感觉也并不是好的案例,先弄一个网盘系统,再用标准的产品 prd ,对比看或许更明显。
    Chuckle
        23
    Chuckle  
       19h 41m ago
    @Chuckle 多 agent 对抗是个方向,毕竟我现在最常干的事情就是让 AI 自己再审查一遍代码,比如“逐行代码对比新老组件的上层扩展适配是否一致,有无逻辑、功能、细节差异,以及潜在的风险”,往往我自己 cr 前先问个几轮,就完成了 99%了能挑出来不少风险和毛病,但这句话要是扔 rules 或者 skill 里貌似不起作用,ai 不会完成代码后自己检查,因为这种提示词和具体业务有关联,找不到黄金提示词,但有另一个 agent 自动介入的话,就能根据业务情景,自动生成这段话
    itechify
        24
    itechify  
    PRO
       19h 11m ago
    不开源嘛
    Leon6868
        25
    Leon6868  
       16h 58m ago
    https://github.com/Chorus-AIDLC/Chorus 相比有什么优势呢?
    zifangsky
        26
    zifangsky  
       11h 0m ago
    这类工具在当前门槛不高了,要开源才能有更好的发展
    Exia2
        27
    Exia2  
    OP
    PRO
       3h 39m ago
    感谢评论,针对评论中提到的 AI 编程瓶颈,分享一下 AnyPal 架构上的工程解法:

    上下文控制
    AnyPal 引入敏捷开发( Plan )模式,通过工程级任务拆分与依赖关系分析,将复杂需求解构为若干个可在 256K 上下文内单次完整迭代的工单,工单下再细分多个子任务。由于单次迭代被严格控制在 256K 标称容量内,执行过程中几乎不需要进行 compact 上下文的操作,避免上下文压缩导致降智。

    多维度的复合记忆系统
    AnyPal 放弃了单一的长文本挂载,转而构建多层级的记忆矩阵来支撑 Agent 决策:

    计划记忆:沉淀软件顶层设计、与当前工单强绑定的代码修改历史、以及工单内的讨论与评论内容。

    经验记忆:自动记录并结构化每次修复 BUG 的根因与应对措施,形成随项目进化的本地经验本。

    全局理解:在本地基于 Tree-sitter 对项目进行 AST 语法树解析和依赖拓扑建模,将代码关系向量化。AI 拆解工单时直接检索该图谱以精准定位局部关联文件,避免盲目全盘扫描造成上下文灾难。

    多 Agent 对抗约束
    AnyPal 内置了 6 个反方角色(测试驱动开发、威胁建模、本地化等),在底层抽象层引入强工程约束与权限隔离,避免大模型在 Chat 框内相互敷衍。以测试驱动开发模式为例:

    权限隔离:反方( Critic )是测试文件的唯一合法编写者。若正方( Coder )试图修改测试路径文件以迎合其 Bug 代码,CoderTestGuard 会强行拦截。

    沙箱运行:反方在安全沙箱中动态编写并运行真实测试(如 Vitest / Pytest 等),将测试结果作为 Evidence 注入结构化 Check-list 倒逼 Coder 改错。只有 Check-list 验收通过且完成验证调用,AI 会话才能 Finalize 结账。

    关于 IDE
    AnyPal 支持 VSCode 插件形态,但受限于环境,功能仅支持对抗式编程。

    关于对比测试确实有些脱离实际且存在操作失误,我们后续会采用真实业务场景和标准产品 PRD 对比测试,感谢您的建议。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3154 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 143ms · UTC 13:32 · PVG 21:32 · LAX 06:32 · JFK 09:32
    ♥ Do have faith in what you're doing.