Skip to content

Vibe Coding 与 Agent 学习路线

这份笔记按图片中的知识地图整理。图里的颜色代表学习优先级:

  • 必须掌握:主线能力,先学这些。
  • 建议掌握:能明显提升效果,但可以在主线跑通后补。
  • 进阶拓展:更深入的工程化、自动化和多智能体内容。
  • 综合案例:把前面的能力组合起来做一个完整项目。

箭头关系也有含义:

  • 实线箭头:依赖关系,后面的内容通常需要前面的基础。
  • 虚线箭头:补充关系,适合在主线之外扩展。
  • 虚线框:你会掌握的概念,但图中没有继续展开子文档。

总览

整张图可以拆成三条路线:

  1. 如何做好 Vibe Coding:从大模型原理、开发工具、提示词工程开始,逐步进入 MVP、迭代开发、上下文管理、RAG、SubAgent 和 Agent Team。
  2. 名词概念速通:从 LLM、Function Calling 讲到 Agent、SubAgent、MCP、Workflow、Langchain、RAG 和 Skill。
  3. DataWhale: hello-agent:从智能体基础一路到主流框架实践、性能评估、通信协议、记忆检索、上下文工程和综合案例。

如何做好 Vibe Coding

1. 大模型原理

Vibe Coding 的起点不是工具,而是理解大模型的基本工作方式。至少要知道模型为什么会生成代码、为什么会出错、为什么需要上下文,以及为什么同一个问题在不同模型上效果差异很大。

建议补充:

  • 多模型协同:发挥每个模型的优势。比如一个模型适合写代码,另一个模型适合解释、审查或生成文档。

从大模型原理往下,会进入开发工具体系。

2. 开发工具大全

开发工具是 Vibe Coding 的放大器。图中把它标成“你将掌握的概念”,说明它是一个工具入口,不是单个知识点。

工具形式很多,主要包括:

  • CLI 综述:命令行里的 AI 编程工具。
  • 插件综述:编辑器或浏览器插件。
  • IDE 综述:集成在开发环境里的 AI 能力。
  • workflow 综述:把固定流程自动化,属于进阶拓展。

工具增强方向:

  • MCP:让模型能接入外部工具、资源和提示词模板。
  • Skill:把固定能力封装成可复用的操作说明或工具能力。
  • MCP 工具推荐:作为 MCP 的补充内容,帮助选择可用工具。

3. Vibe Coding 范式导论

选好工具后,进入 Vibe Coding 的基本范式。

核心问题是:如何描述需求?

不要只说“帮我做一个功能”,而是要描述清楚:

  • 目标是什么。
  • 用户会看到什么。
  • 输入和输出是什么。
  • 哪些文件或模块相关。
  • 哪些行为不能被破坏。
  • 什么结果算完成。

4. 提示词工程

提示词工程的重点不是写花哨的话,而是先建立总体框架。

一个有效提示词通常包含:

  • 背景:项目是什么,当前状态是什么。
  • 目标:要实现什么。
  • 约束:不能改什么,必须遵守什么。
  • 验收:如何判断任务完成。

先让模型理解全局,再让它处理局部。这样更容易减少跑偏和反复返工。

5. 最小可行产品

提示词之后先做 MVP,也就是最小可行产品。

MVP 的目标不是完美,而是尽快得到一个可以运行、可以验证的版本。需要注意:模型输出不一定正确,因此要补上:

  • 代码审核与幻觉识别:检查 API 是否真实存在、逻辑是否合理、边界情况是否被处理。

6. 迭代式开发循环

一轮对话往往不够达到目标。Vibe Coding 更像是循环:

  1. 描述需求。
  2. 生成第一版。
  3. 运行或阅读结果。
  4. 指出具体问题。
  5. 继续修改。

进阶拓展:

  • Hooks:把一些反复操作自动化,比如格式化、测试、构建、生成摘要等。

迭代多了以后,上下文会越来越多,因此需要继续学习:

  • 上下文管理和代码质量:控制模型看到的信息,避免上下文混乱。
  • RAG:提供更好的上下文,让模型能检索项目资料、文档或代码片段。
  • SubAgent:把一部分任务交给独立上下文的子智能体处理。
  • Agent Team:多个 Agent 协作完成更复杂的任务。

还有一个常见问题:一开始就反复澄清需求,会得到需求文档、设计文档和流程文档,容易产生大量冗余工作。可以通过:

  • 自然语言编程规范:把需求描述、设计、验收标准写得更稳定,减少重复沟通。

名词概念速通

1. 从 LLM 到 Agent

理解 Agent 要从 LLM 说起。

LLM 本身只会根据上下文生成文本。如果大模型想上网查资料、调用工具或读取外部数据,就需要一种机制把“想做的动作”变成真实操作。

这个机制就是:

  • Function Calling:模型输出结构化调用意图,由外部程序解析并执行。

接着会遇到问题:谁来解析 Function Calling?

答案就是:

  • Agent:负责规划、调用工具、读取结果、继续推理,并把多个步骤串起来。

如果任务太复杂,或者不同任务之间需要隔离上下文,就需要:

  • SubAgent:用独立上下文处理局部任务,减少主上下文污染。

2. MCP 及其三大原语

对于一些比较固化的操作,Agent 直接自由发挥不稳定。这时可以用 MCP 把能力标准化。

MCP 主要提供三类原语:

  • Tool:工具调用。Agent 可以通过 Tool 使用联网搜索、数据库、文件系统、API 等能力,获取数据或执行动作。
  • Resource:资源读取。给 Agent 提供文档、数据、项目上下文等可读取资源。
  • Prompt:提示词模板。复用稳定的提示词结构,减少重复写提示词。

这些能力由:

  • MCP Server 提供。

Tool 还可以用来增强上下文:

  • RAG:让 Agent 检索相关资料,再把检索结果放入上下文。

3. Workflow、Langchain 与 Skill

如果某些操作比较固定,但直接交给 Agent 又不稳定,可以把它们做成 Workflow。

Workflow 的路线:

  • workflow:把稳定流程写出来。
  • 工作流设计 / ReAct 等:设计“思考、行动、观察”的循环。
  • Langchain:用框架实现 Agent 工作流。
  • 多代理系统 / LangGraph 等:进阶到多 Agent 编排。
  • 可视化编排:当代码太难时,用可视化方式组织流程。
  • Skill:当操作太细,比如区分文件格式、选择工具和文档时,把能力封装成 Skill,让 Agent 自由选取。

DataWhale: hello-agent 路线

这条路线更像系统课程,从基础到案例逐步推进。

1. 基础主线

先按顺序掌握:

  1. 初识智能体
  2. 智能体发展史
  3. 大语言模型基础
  4. 智能体经典范式构建

其中“初识智能体”到“智能体发展史”之间,重点是理解技术发展脉络。

2. 框架与实践

当代码太难时,可以先试试拖拽式或低代码路线:

  • 基于低代码平台开发的智能体搭建

主线仍然要进入:

  1. 主流框架开发实践
  2. 构建你的 Agent 框架
  3. 智能体性能评估

3. 记忆、检索与上下文

多轮对话需要记忆,但光有记忆还不够,还需要方法构建上下文:

  1. 记忆与检索
  2. 上下文工程

上下文工程的目标是让 Agent 在长任务里保留关键信息,并能找回需要的资料。

4. 工具、协议与协作

另一个关键问题是:如何让智能体能够用工具?

路线是:

  1. 智能体通信协议
  2. MCP 与多智能体协作
  3. 智能旅行助手
  4. 构建赛博小镇

进阶拓展:

  • Agentic_RL:研究如何让智能体更好地使用工具。

推荐学习顺序

如果目标是先把 Vibe Coding 用起来,推荐顺序是:

  1. 大模型原理
  2. 开发工具大全
  3. Vibe Coding 范式导论
  4. 提示词工程
  5. 最小可行产品
  6. 代码审核与幻觉识别
  7. 迭代式开发循环
  8. 上下文管理和代码质量
  9. RAG
  10. SubAgent
  11. Agent Team

如果目标是系统理解 Agent,推荐顺序是:

  1. LLM
  2. Function Calling
  3. Agent
  4. SubAgent
  5. MCP 及其三大原语
  6. Tool、Resource、Prompt
  7. MCP Server
  8. Workflow
  9. Langchain
  10. LangGraph 等多代理系统
  11. Skill

最后记法

Vibe Coding 的核心不是“让 AI 替我写完所有代码”,而是把人和模型的分工变清楚:

  • 人负责目标、判断、验收和取舍。
  • 模型负责生成、改写、补全和加速重复劳动。
  • 工具负责连接真实环境。
  • Agent 负责把多步骤任务串起来。
  • 上下文工程负责让模型在正确的信息里工作。

先用主线跑通,再补工具、MCP、RAG、SubAgent 和 Workflow。这样学习顺序最稳。