• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 47 days ago, the information mentioned may be changed or developed.

过去半年，我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快，但随着项目规模扩大，技术债开始爆发。
Vibe Coding 的核心问题并不在于某几行代码的质量低下，而在于它完全缺乏全局观，且不遵循软件工程的规范。
没有宏观架构，没有项目长期记忆，没有自动化审计，我们意识到 Vibe Coding Is Not Engineering 。
为了使 AI 编程更符合软件工程规范，我们开发了这个项目。

AnyPal：将 Vibe Coding 带入软件工程时代

AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台，支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时，引入了软件工程的规范。

多 Agent 协同与对抗审计：内置工程经理，架构师等 11 个 AI 角色与 6 个反方审查员，支持 Coder 与 Adversary （测试/安全等）多 Agent 左右互搏，在代码交付前完成质量闭环。

成本优化：对抗审计配合 S/M/L/XL 任务规模自动切换模型，可以极大降本增效，将 Token 花在刀刃上。

项目长期记忆：基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱，设立 Postmortem 工作区，自动复盘每个 BUG ，沉淀经验随项目共同进化。

支持敏捷迭代（ Plan 模式）和对抗式编程。

敏捷开发：看板工作区

切换到 Plan 模式后，系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。
和项目经理对话，将你的意图拆解为具备前后置依赖关系的树状任务流，统筹项目全局推进，多任务并行开发，不再需要打开多个 Chat 对话。
在线/离线模式: 用户在线时主动追问对齐需求，提前确认方案。用户离线后自主推进看板任务。

对抗式编程

多 Agent 共享代码库与会话，正方写代码，反方实时审计，在代码进入暂存区前置阻断与纠偏，避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销，大幅提质代码产出质量，对中小模型效果尤为明显。

实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7

这是项目早期的一个极端测试：在完全不人工干涉的情况下，让 AI 独立使用 WebDAV 协议实现一个网盘系统。

AnyPal 组：正方（ Coder ）使用 DeepSeek-V4-Flash ，反方（审查）使用 DeepSeek-V4-Pro 。

对照组：GitHub Copilot + Opus 4.7 。

在此案例中，资源消耗相近的情况下，AnyPal 凭借工程化闭环实现 10 倍以上的性价比。

一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/

UI 预览功能

在 AI 编程的时候 UI 也是一大痛点，回滚不仅浪费 Token ，还可能影响其他组件。
现在 AI 在开始前会先询问需求，给出数个方案和预览，您可以选择其一或者继续修改需求。

自动复盘

AI 修复 BUG 后自动生成 Markdown 复盘文档，记录严重程度、时间线、根因、修复措施，并关联可回放的 Agent 会话，随时追溯决策过程。该文档会进入项目的长期记忆，随项目共同进化。

参与内测

项目地址： https://anypal.pome.net/

支持免登录，自行导入大模型 API 使用。

注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。

推荐使用客户端体验完整功能

加入 Q 群：497719526 领取限量 Token 补贴。

我们正在寻找视频团队和测评博主合作，如果您有意向请联系我们。

Supplement 1 · Jun 9

感谢 @felixcode 纠错。在对照实验中，Copilot 确实弹出了功能勾选列表，由于我们的操作失误，没有注意到 Web UI 的选项，从而直接导致 Opus 交付了无 UI 的原生目录界面。

此次实验因我们的疏忽，未能做到客观、严谨，导致原文中“Opus 没做 UI”的结论与事实不符。在此，我们向大家真诚致歉，也感谢 @felixcode 帮我们纠正了错误。

目前 AnyPal 刚开启内测，我们深知产品和团队都有很多不完美的地方，欢迎大家提出意见，我们会重视每个反馈。

工程

审计

项目

27 replies • 2026-06-10 17:52:54 +08:00

orcl

Jun 9

看着有点牛逼

dayuzhu

Jun 9

mac 没有客户端吗?

Varvel

Jun 9

785150334 497719526 都搜不到群

shoushen

Jun 9

感觉确实不错，建议 b 站发个视频，然后在网站首页放一下，降低用户的认知成本。

shoushen

Jun 9

特别是讲一下每一项功能实现的技术原理和可以获得的收益、实现的效果。

Exia2

PRO

Jun 9

@Varvel 抱歉了，开了搜索也搜不到，不知道什么原因，http://anypal.net/网页底部有二维码

Exia2

PRO

Jun 9

@dayuzhu Mac 端还在走流程，预计 3 天后上线

Branlice

Jun 9

MCN 团队，视频可以合作 ZGV2aWxlcjIwMjY=

connor123

Jun 9

专业开发者用不上，小白看不懂

Orchestraa

Jun 9

推广发在对应的板块吧

emiyamuto

Jun 9

我理解就是你们这个工具解决的就是 hardness 的问题，通过约束 ai 行为进行 coding

FinnBai

Jun 9

建议放在推广节点

等 mac 客户端出了试一下，之前用过一个类似的，产品使用逻辑上不太好用

xiaomushen

Jun 9

一看就不想用的样子。。。

Exia2

PRO

Jun 9

@Orchestraa 明白了下次发推广

Leon6868

Jun 9

像是专门用了 mica-electron ，有心了

sin2624

Jun 9

想到一块去了，一套几乎一样的东西在 Agent 自举开发中😂

felixcode

PRO

Jun 9

GitHub Copilot + Opus 4.7 里，你不提需求，就变成它没做 UI ？
主动提供的 WEB UI 选项是被你给吃了吗？

wbrobot

Jun 10

多少？ 527M ？？你往里面放了个 winxp sp3 的 ISO 吗？

azadmin

Jun 10 via Android

@wbrobot Codex 桌面版也差不多这么大

azadmin

Jun 10 via Android

对接中转站貌似有点问题，模型发现失败: Cannot create property '[object Object]' on string 'codex-auto-review'

Exia2

PRO

Jun 10

@azadmin 欢迎进群反馈，开发会直接跟您沟通

Chuckle

Jun 10

界面好看，有空试试，不过学习一个新工具成本还高，现阶段专业的还是脱离不了 ide 或者 codex cc 成熟的 agent 生态，以及 vb 上绕不过去的 codex app 大山。如果给成熟的 agent 做“外围插件”，什么记忆系统之类的，难免会受限，像支持 hook 、plugin 的 agent 也没多少，更别说更深层的定制改动了，不够自由，但自己做 agent ，同质化和换工具成本高。如果只是免费注册用 api ，推广的吸引力还是不够，毕竟凹凸曼大善人，时不时来个 bug gpt5.5 就 free 了，还有一堆中转站。
我实践时也发现 op 所言，它完全缺乏全局观，agent 本身只是个“操作系统”，在复杂老项目中，完成需求任务，更多的瓶颈不是上下文大小、agent 能力，而是上层应用，只有 agent ，AI 不知道业务架构，AI 无法从一个页面上，定位到你成百上千的仓库改哪个文件，AI 无法完成测试闭环，这背后还有需求分析、业务数字化、代码地图、质量审计的事情，以及模仿阿尔法狗进化的老路子，让 AI 自己学习经验，试错才是最宝贵的，这也是我边做需求边做 ai 工作流头疼的点。
多 agent 弄个对抗网络的设计，之前好像也见过，但实际开发并不会像 demo 那样一段话生成***，自由度没这么高，也不是单仓库项目，往往是涉及多个仓库，多个包。
多 agent 对抗、规范沉淀，加上需求复杂性导致不可避免的上下文压缩，感觉有让 AI 偏离原有的产品 prd 设计方向的风险。
另外对比图也过于夸张了，opus4.7 不至于，一句话生成***不仅听腻了，感觉也并不是好的案例，先弄一个网盘系统，再用标准的产品 prd ，对比看或许更明显。

Chuckle

Jun 10

@Chuckle 多 agent 对抗是个方向，毕竟我现在最常干的事情就是让 AI 自己再审查一遍代码，比如“逐行代码对比新老组件的上层扩展适配是否一致，有无逻辑、功能、细节差异，以及潜在的风险”，往往我自己 cr 前先问个几轮，就完成了 99%了能挑出来不少风险和毛病，但这句话要是扔 rules 或者 skill 里貌似不起作用，ai 不会完成代码后自己检查，因为这种提示词和具体业务有关联，找不到黄金提示词，但有另一个 agent 自动介入的话，就能根据业务情景，自动生成这段话

itechify

PRO

Jun 10

不开源嘛

Leon6868

Jun 10

和 https://github.com/Chorus-AIDLC/Chorus 相比有什么优势呢？

zifangsky

Jun 10

这类工具在当前门槛不高了，要开源才能有更好的发展

Exia2

PRO

Jun 10

感谢评论，针对评论中提到的 AI 编程瓶颈，分享一下 AnyPal 架构上的工程解法：

上下文控制
AnyPal 引入敏捷开发（ Plan ）模式，通过工程级任务拆分与依赖关系分析，将复杂需求解构为若干个可在 256K 上下文内单次完整迭代的工单，工单下再细分多个子任务。由于单次迭代被严格控制在 256K 标称容量内，执行过程中几乎不需要进行 compact 上下文的操作，避免上下文压缩导致降智。

多维度的复合记忆系统
AnyPal 放弃了单一的长文本挂载，转而构建多层级的记忆矩阵来支撑 Agent 决策：

计划记忆：沉淀软件顶层设计、与当前工单强绑定的代码修改历史、以及工单内的讨论与评论内容。

经验记忆：自动记录并结构化每次修复 BUG 的根因与应对措施，形成随项目进化的本地经验本。

全局理解：在本地基于 Tree-sitter 对项目进行 AST 语法树解析和依赖拓扑建模，将代码关系向量化。AI 拆解工单时直接检索该图谱以精准定位局部关联文件，避免盲目全盘扫描造成上下文灾难。

多 Agent 对抗约束
AnyPal 内置了 6 个反方角色（测试驱动开发、威胁建模、本地化等），在底层抽象层引入强工程约束与权限隔离，避免大模型在 Chat 框内相互敷衍。以测试驱动开发模式为例：

权限隔离：反方（ Critic ）是测试文件的唯一合法编写者。若正方（ Coder ）试图修改测试路径文件以迎合其 Bug 代码，CoderTestGuard 会强行拦截。

沙箱运行：反方在安全沙箱中动态编写并运行真实测试（如 Vitest / Pytest 等），将测试结果作为 Evidence 注入结构化 Check-list 倒逼 Coder 改错。只有 Check-list 验收通过且完成验证调用，AI 会话才能 Finalize 结账。

关于 IDE
AnyPal 支持 VSCode 插件形态，但受限于环境，功能仅支持对抗式编程。

关于对比测试确实有些脱离实际且存在操作失误，我们后续会采用真实业务场景和标准产品 PRD 对比测试，感谢您的建议。

Vibe Coding 不是软件工程？符合软件工程规范的 AI 软件工程平台来了。

AnyPal：将 Vibe Coding 带入软件工程时代

敏捷开发：看板工作区

对抗式编程

实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7

UI 预览功能

自动复盘

参与内测