最近整理了一个开源学习项目:
Enterprise Agent Platform Engineering https://github.com/datagallery-lab/enterprise_agent_platform
项目主要关注一个问题:
很多大模型 Agent Demo 看起来能跑,但如果面试官继续追问“如何进入企业生产环境”,通常就会涉及一整套工程化问题:
- Agent 如何管理工具权限?
- Tool Calling 失败后如何重试和降级?
- RAG 答错了,如何定位是检索、召回、排序还是生成问题?
- Memory 应该存什么,不应该存什么?
- Planner 如何拆解任务,如何避免无限循环?
- Agent 执行链路如何 Trace ?
- 如何评价一个 Agent 系统是否真的有效?
- DataAgent / NL2SQL 如何保证 SQL 安全、准确、可审计?
- 如何控制大模型调用成本和延迟?
- 企业内部上线 Agent ,需要哪些安全、权限、审计和合规机制?
这个项目不是“20 分钟做一个聊天机器人”的教程,而是尝试从面试和工程实践角度,把 Agent 从 Demo 到生产级平台中间缺失的能力系统梳理出来。
目前内容包括:
- Agent Runtime
- Tool Registry
- Planner / Memory
- RAG / Knowledge System
- DataAgent / NL2SQL
- Trace / Observability
- Eval
- Cost Governance
- Security / Compliance
- Deployment
形式是 open book + companion mini-platform。 open book 用来梳理知识地图,mini-platform 用来把部分架构概念映射到代码结构中。
我觉得它比较适合准备这些方向的同学:
- 大模型应用开发
- Agent 工程
- RAG / 企业知识库
- DataAgent / NL2SQL
- LLMOps / AI Infra
- AI 平台工程
- 数据智能系统
- 大模型系统设计
如果面试里只会说“我做过一个 Agent Demo”,其实很容易被继续追问到工程细节。更好的准备方式可能是理解:
一个 Agent 要真正上线,需要哪些 Runtime 、Tool 、Memory 、Trace 、Eval 、Security 、Cost 和 Deployment 能力。
欢迎大家提 issue 。尤其想听听大家对下面几个问题的建议:
- 面试中 Agent / RAG / DataAgent 哪些问题最常被追问?
- 目前这类学习资料还缺哪些内容?
- mini-platform 更应该优先补哪些代码示例?
- 企业 Agent 落地时还有哪些常见坑?