Vibe Coding 与 Agent 学习路线
这份笔记按图片中的知识地图整理。图里的颜色代表学习优先级:
- 必须掌握:主线能力,先学这些。
- 建议掌握:能明显提升效果,但可以在主线跑通后补。
- 进阶拓展:更深入的工程化、自动化和多智能体内容。
- 综合案例:把前面的能力组合起来做一个完整项目。
箭头关系也有含义:
- 实线箭头:依赖关系,后面的内容通常需要前面的基础。
- 虚线箭头:补充关系,适合在主线之外扩展。
- 虚线框:你会掌握的概念,但图中没有继续展开子文档。
总览
整张图可以拆成三条路线:
- 如何做好 Vibe Coding:从大模型原理、开发工具、提示词工程开始,逐步进入 MVP、迭代开发、上下文管理、RAG、SubAgent 和 Agent Team。
- 名词概念速通:从 LLM、Function Calling 讲到 Agent、SubAgent、MCP、Workflow、Langchain、RAG 和 Skill。
- DataWhale: hello-agent:从智能体基础一路到主流框架实践、性能评估、通信协议、记忆检索、上下文工程和综合案例。
如何做好 Vibe Coding
1. 大模型原理
Vibe Coding 的起点不是工具,而是理解大模型的基本工作方式。至少要知道模型为什么会生成代码、为什么会出错、为什么需要上下文,以及为什么同一个问题在不同模型上效果差异很大。
建议补充:
- 多模型协同:发挥每个模型的优势。比如一个模型适合写代码,另一个模型适合解释、审查或生成文档。
从大模型原理往下,会进入开发工具体系。
2. 开发工具大全
开发工具是 Vibe Coding 的放大器。图中把它标成“你将掌握的概念”,说明它是一个工具入口,不是单个知识点。
工具形式很多,主要包括:
- CLI 综述:命令行里的 AI 编程工具。
- 插件综述:编辑器或浏览器插件。
- IDE 综述:集成在开发环境里的 AI 能力。
- workflow 综述:把固定流程自动化,属于进阶拓展。
工具增强方向:
- MCP:让模型能接入外部工具、资源和提示词模板。
- Skill:把固定能力封装成可复用的操作说明或工具能力。
- MCP 工具推荐:作为 MCP 的补充内容,帮助选择可用工具。
3. Vibe Coding 范式导论
选好工具后,进入 Vibe Coding 的基本范式。
核心问题是:如何描述需求?
不要只说“帮我做一个功能”,而是要描述清楚:
- 目标是什么。
- 用户会看到什么。
- 输入和输出是什么。
- 哪些文件或模块相关。
- 哪些行为不能被破坏。
- 什么结果算完成。
4. 提示词工程
提示词工程的重点不是写花哨的话,而是先建立总体框架。
一个有效提示词通常包含:
- 背景:项目是什么,当前状态是什么。
- 目标:要实现什么。
- 约束:不能改什么,必须遵守什么。
- 验收:如何判断任务完成。
先让模型理解全局,再让它处理局部。这样更容易减少跑偏和反复返工。
5. 最小可行产品
提示词之后先做 MVP,也就是最小可行产品。
MVP 的目标不是完美,而是尽快得到一个可以运行、可以验证的版本。需要注意:模型输出不一定正确,因此要补上:
- 代码审核与幻觉识别:检查 API 是否真实存在、逻辑是否合理、边界情况是否被处理。
6. 迭代式开发循环
一轮对话往往不够达到目标。Vibe Coding 更像是循环:
- 描述需求。
- 生成第一版。
- 运行或阅读结果。
- 指出具体问题。
- 继续修改。
进阶拓展:
- Hooks:把一些反复操作自动化,比如格式化、测试、构建、生成摘要等。
迭代多了以后,上下文会越来越多,因此需要继续学习:
- 上下文管理和代码质量:控制模型看到的信息,避免上下文混乱。
- RAG:提供更好的上下文,让模型能检索项目资料、文档或代码片段。
- SubAgent:把一部分任务交给独立上下文的子智能体处理。
- Agent Team:多个 Agent 协作完成更复杂的任务。
还有一个常见问题:一开始就反复澄清需求,会得到需求文档、设计文档和流程文档,容易产生大量冗余工作。可以通过:
- 自然语言编程规范:把需求描述、设计、验收标准写得更稳定,减少重复沟通。
名词概念速通
1. 从 LLM 到 Agent
理解 Agent 要从 LLM 说起。
LLM 本身只会根据上下文生成文本。如果大模型想上网查资料、调用工具或读取外部数据,就需要一种机制把“想做的动作”变成真实操作。
这个机制就是:
- Function Calling:模型输出结构化调用意图,由外部程序解析并执行。
接着会遇到问题:谁来解析 Function Calling?
答案就是:
- Agent:负责规划、调用工具、读取结果、继续推理,并把多个步骤串起来。
如果任务太复杂,或者不同任务之间需要隔离上下文,就需要:
- SubAgent:用独立上下文处理局部任务,减少主上下文污染。
2. MCP 及其三大原语
对于一些比较固化的操作,Agent 直接自由发挥不稳定。这时可以用 MCP 把能力标准化。
MCP 主要提供三类原语:
- Tool:工具调用。Agent 可以通过 Tool 使用联网搜索、数据库、文件系统、API 等能力,获取数据或执行动作。
- Resource:资源读取。给 Agent 提供文档、数据、项目上下文等可读取资源。
- Prompt:提示词模板。复用稳定的提示词结构,减少重复写提示词。
这些能力由:
- MCP Server 提供。
Tool 还可以用来增强上下文:
- RAG:让 Agent 检索相关资料,再把检索结果放入上下文。
3. Workflow、Langchain 与 Skill
如果某些操作比较固定,但直接交给 Agent 又不稳定,可以把它们做成 Workflow。
Workflow 的路线:
- workflow:把稳定流程写出来。
- 工作流设计 / ReAct 等:设计“思考、行动、观察”的循环。
- Langchain:用框架实现 Agent 工作流。
- 多代理系统 / LangGraph 等:进阶到多 Agent 编排。
- 可视化编排:当代码太难时,用可视化方式组织流程。
- Skill:当操作太细,比如区分文件格式、选择工具和文档时,把能力封装成 Skill,让 Agent 自由选取。
DataWhale: hello-agent 路线
这条路线更像系统课程,从基础到案例逐步推进。
1. 基础主线
先按顺序掌握:
- 初识智能体
- 智能体发展史
- 大语言模型基础
- 智能体经典范式构建
其中“初识智能体”到“智能体发展史”之间,重点是理解技术发展脉络。
2. 框架与实践
当代码太难时,可以先试试拖拽式或低代码路线:
- 基于低代码平台开发的智能体搭建
主线仍然要进入:
- 主流框架开发实践
- 构建你的 Agent 框架
- 智能体性能评估
3. 记忆、检索与上下文
多轮对话需要记忆,但光有记忆还不够,还需要方法构建上下文:
- 记忆与检索
- 上下文工程
上下文工程的目标是让 Agent 在长任务里保留关键信息,并能找回需要的资料。
4. 工具、协议与协作
另一个关键问题是:如何让智能体能够用工具?
路线是:
- 智能体通信协议
- MCP 与多智能体协作
- 智能旅行助手
- 构建赛博小镇
进阶拓展:
- Agentic_RL:研究如何让智能体更好地使用工具。
推荐学习顺序
如果目标是先把 Vibe Coding 用起来,推荐顺序是:
- 大模型原理
- 开发工具大全
- Vibe Coding 范式导论
- 提示词工程
- 最小可行产品
- 代码审核与幻觉识别
- 迭代式开发循环
- 上下文管理和代码质量
- RAG
- SubAgent
- Agent Team
如果目标是系统理解 Agent,推荐顺序是:
- LLM
- Function Calling
- Agent
- SubAgent
- MCP 及其三大原语
- Tool、Resource、Prompt
- MCP Server
- Workflow
- Langchain
- LangGraph 等多代理系统
- Skill
最后记法
Vibe Coding 的核心不是“让 AI 替我写完所有代码”,而是把人和模型的分工变清楚:
- 人负责目标、判断、验收和取舍。
- 模型负责生成、改写、补全和加速重复劳动。
- 工具负责连接真实环境。
- Agent 负责把多步骤任务串起来。
- 上下文工程负责让模型在正确的信息里工作。
先用主线跑通,再补工具、MCP、RAG、SubAgent 和 Workflow。这样学习顺序最稳。