周末参加了一个 AI Agents 主题的黑客松,最后运气不错拿了一等奖。
这帖不是来晒奖的,主要是想分享一下这次和 Codex 一起打黑客松的过程。比赛结束后我翻了一下两天里的聊天记录,发现里面其实留下了一条挺完整的路径:怎么选方向、怎么误判、怎么止损、怎么收敛 demo 、怎么准备 Q&A 。
所以顺手把它整理成了一个开源 Skill:
https://github.com/kangkona/kangkona-skills
里面目前有一个 Hackathon Skill ,算是一个黑客松实战手册。目标不是教人 hack 比赛规则,也不是拿旧项目包装参赛,而是整理一下在有限时间里,怎么和 AI Coding Agent 协作,把一个想法尽量收敛成能讲清楚、能跑起来、能回答问题的作品。
这次比较大的体感是:现在写代码反而不一定是最难的部分。
有 Codex / Claude Code 以后,很多东西确实能很快堆出来。但黑客松里真正容易翻车的是:
- 方向一开始就选偏了
- 想法越聊越大,最后 demo 讲不清楚
- 做出来只是个 API wrapper ,自己也说服不了自己
- 半天过去发现效果不对,但舍不得止损
- PPT 、视频、Q&A 到最后才开始补
我这次一开始也没马上进入 coding ,而是试了好几个方向。财务 Agent 、研究分析、企业工作流、Coding Agent 协作工具都看过一点。中间还顺手试了几个之前一直想试但没认真用过的技术栈,比如 TanStack Starter 、Astro 、Mastra 、Flux 、Cloudflare 全家桶。
最后发现,工具本身倒不一定是最大的问题。
真正的问题是:你脑子里想象的产品,和实际做出来的 demo 之间,经常会有很大的 gap 。
尤其是和 Agent 一起脑暴的时候,很容易越聊越大:加一个角色、加一个面板、加一个流程、加一个自动化动作。看起来越来越完整,但也越来越不像一个 4 分钟能讲清楚、现场能稳定演示的东西。
后来让我收敛到最终方向的,是一篇 Lenny 采访 Claude Code 团队负责人的文章。里面有个观点我印象很深:
当 AI 让写代码变快以后,验证和信任会变成新的瓶颈。
我之前在字节做过很多年 AB 测试和实验评估,所以看到这个点会有一种熟悉感。AB 测试本质上也是在大规模组织里解决“变化如何被验证、如何被信任”的问题。
于是我重新理解了 Coding Agent 赛道:
机会可能不在于“再做一个 Coding Agent”。这个方向很难和 Codex 、Claude Code 、Cursor 正面对打。
更有意思的点可能在 Coding Agent 之后。
当个人写代码变快以后,团队会遇到新的问题:
Agent 做了什么? 尝试过哪些方案? 有没有跑测试? 留下了什么证据? 什么时候可以进 PR ? 谁来 review ? 谁来 approve ? 团队怎么信任这一次 Agent loop ?
所以最后做了 TeamLoop ,一个偏团队级 Loop Engineering 的东西。它不是替代 Codex / Claude Code ,而是把本地 Agent 的执行过程、证据、review 和 approval 串起来,让团队在 PR 之前就能看见一次 Agent loop 的状态。
赛后我把这套过程抽象成了 Hackathon Skill ,大概包含这些原则:
- 先读评分标准,不要先写代码
- 一开始可以多方向赛马,但不要恋战
- 尽快判断 demo 能不能闭环
- 每个方向都问一句:能不能在几分钟内讲清楚
- 截止时间越近,越要从探索模式切到交付模式
- AI 很适合帮你并行探索,但人要负责判断和取舍
- 黑客松不是 hack 比赛规则,而是在有限时间里更认真地理解问题、做出东西、和人交流
目前这个 Skill 还比较早期,算是从这次比赛过程里蒸馏出来的 v1 。
如果大家也经常参加黑客松、Demo Day ,或者用 Codex / Claude Code 做项目,欢迎拍砖。
也想顺便讨论一个问题:
当 AI Coding 让“写代码”越来越快之后,团队研发流程里下一个真正的瓶颈会是什么?
长文版之前发在公众号,这里就不强推了,感兴趣可以看: https://mp.weixin.qq.com/s/W9sgM7adkPwm1eRMBUsAtg