概念大全
🎯 为什么需要了解这些概念
在学习 Vibe Coding 的过程中,会遇到各种陌生的名词和术语:Token、上下文窗口、RAG 等。这些概念听起来高大上,但理解起来并不难。掌握这些术语,能帮助你更好地理解 AI 编程工具的工作原理,从而更高效地使用它们。
📊 核心概念详解
Token(令牌/词元)
AI 处理文本的基本单位,可以是一个字、一个词,甚至是一个标点符号。
提示
你可以把 Token 想象成 AI 的"货币"。每次你和 AI 对话,都需要消耗 Token。Prompt(提示词)越长、生成的回复越长,消耗的 Token 就越多。
关键要点:
- 中文通常 1 个字 ≈ 1-2 个 Token
- 英文通常 1 个单词 ≈ 1-2 个 Token
- Token 消耗直接关系到使用成本
上下文窗口(Context Window)
AI 能"记住"的上下文长度限制,也就是一次对话中 AI 能参考的最大 Token 数量。
提示
就像人的短期记忆一样,上下文窗口决定了 AI 能同时处理多少信息。窗口越大,AI 能参考的代码和对话历史就越多。
常见模型上下文窗口:
| 模型 | 上下文窗口 |
|---|---|
| GPT-4 | 128K tokens |
| Claude 3 | 200K tokens |
| Gemini 1.5 | 1M+ tokens |
应用场景:
- 小窗口:简单问答、单文件编辑
- 大窗口:整个代码库分析、长文档理解
Prompt(提示词)
你给 AI 的指令或问题,告诉 AI 你想要什么。
提示
Prompt 是 Vibe Coding 的核心技能。同样的需求,不同的 Prompt 质量,会得到完全不同的结果。
Prompt 优化原则:
- 清晰具体:明确说明想要什么
- 提供上下文:给 AI 足够的背景信息
- 使用示例:用例子说明期望的输出格式
- 分解任务:复杂任务拆分成小步骤
RAG(检索增强生成)
AI 在回答问题时,先从知识库中检索相关信息,再结合这些信息生成回答。
提示
就像开卷考试一样,RAG 让 AI 可以"查阅资料"后再回答,而不是仅凭记忆。这样回答更准确、更专业。
工作流程:
用户提问 → 检索相关知识 → 整合信息 → 生成回答在 Vibe Coding 中的应用:
- 代码库智能问答
- 文档自动生成
- 基于私有代码的辅助编程
Agent(智能体)
能够自主规划、使用工具、完成复杂任务的 AI 系统。
提示
Agent 不只是回答问题,它能像人一样思考:理解任务 → 制定计划 → 执行步骤 → 检查结果 → 调整策略。
Agent 的核心能力:
- 自主规划:将复杂任务拆解为可执行步骤
- 工具调用:使用外部工具(如搜索、代码执行)
- 记忆管理:记住之前的操作和结果
- 错误处理:遇到问题能自我修正
代表产品:Claude Code、Cursor Agent Mode、GitHub Copilot Chat
MCP(Model Context Protocol)
模型上下文协议,让 AI 能够安全地连接外部工具和数据的开放标准。
提示
你可以把 MCP 想象成 AI 的"USB 接口"。通过这个标准接口,AI 可以连接各种外部服务(数据库、文件系统、API 等),大大扩展能力边界。
核心价值:
- 标准化:统一接口,降低集成成本
- 安全性:受控访问,保护数据安全
- 生态丰富:社区提供大量现成 MCP Server
幻觉(Hallucination)
AI 生成看似合理但实际错误的内容。
提示
AI 有时候会"一本正经地胡说八道"。它可能引用不存在的函数、生成错误的代码逻辑,或者编造不存在的文档。这是使用 AI 时必须警惕的问题。
应对策略:
- 人工验证关键代码
- 要求 AI 提供参考来源
- 分步骤验证,及时纠错
- 对不确定的信息进行二次确认
温度(Temperature)
控制 AI 输出随机性的参数,范围通常为 0-2。
提示
温度越低,AI 越"保守",输出越确定、越严谨;温度越高,AI 越"有创意",输出越多样、越随机。
参数选择建议:
| 温度值 | 适用场景 |
|---|---|
| 0.0-0.3 | 代码生成、数学计算(需要精确) |
| 0.5-0.7 | 一般对话、内容创作(平衡) |
| 0.8-1.2 | 头脑风暴、创意写作(需要多样性) |
嵌入(Embedding)
将文本、代码等内容转换成向量(数字数组),用于语义搜索和相似度计算。
提示
嵌入让 AI 能理解"意思相近"的内容。比如"苹果"和"水果"在向量空间中距离很近,这样 AI 就能找到相关的代码片段或文档。
应用场景:
- 代码库语义搜索
- 相似代码推荐
- 文档智能分类
微调(Fine-tuning)
在预训练模型的基础上,用特定领域的数据进一步训练,让模型更擅长特定任务。
提示
就像通用医生进修专科一样,微调让通用 AI 模型变成特定领域的专家(如专门写 Python、专门理解你的代码库)。
适用情况:
- 有特定代码规范需要遵循
- 需要理解私有领域知识
- 追求极致的代码生成质量
多模态(Multimodal)
AI 能同时理解和处理多种类型的数据(文本、图片、音频、视频)。
提示
多模态让 AI 不仅能读代码,还能看懂设计图、理解界面截图、甚至分析视频演示。这大大扩展了 Vibe Coding 的可能性。
应用场景:
- 根据设计图生成前端代码
- 截图报错信息让 AI 诊断
- 语音描述需求直接生成代码
🔧 概念关系图
Vibe Coding 核心概念关系
Prompt(提示词)
↓
Token(基本单位) ←→ 上下文窗口(记忆限制)
↓
Agent(智能执行) ←→ MCP(工具连接)
↓
RAG(知识增强) ←→ 嵌入(语义理解)
↓
生成结果 ←→ 幻觉(质量风险)
↓
微调(优化)/ 温度(调节)/ 多模态(扩展)⚔️ 概念对比表
| 概念 A | 概念 B | 区别 |
|---|---|---|
| Token | 上下文窗口 | Token 是单位,上下文窗口是容量上限 |
| Prompt | 上下文 | Prompt 是输入,上下文包含对话历史 |
| RAG | 微调 | RAG 是动态检索,微调是静态训练 |
| Agent | 传统 AI | Agent 能自主执行,传统 AI 仅响应 |
| 温度 | Top-p | 温度控制随机性,Top-p 控制多样性 |
| 嵌入 | 关键词 | 嵌入理解语义,关键词匹配字面 |
💡 实用记忆技巧
| 概念 | 记忆口诀 |
|---|---|
| Token | "AI 的货币,按量计费" |
| 上下文窗口 | "短期记忆,容量有限" |
| RAG | "开卷考试,有据可查" |
| Agent | "智能代理,自主执行" |
| 幻觉 | "AI 说胡话,需要核实" |
| 温度 | "低温严谨,高温创意" |
| MCP | "USB 接口,即插即用" |
🌟 核心要点总结
提示
理解这些概念不是为了背定义,而是为了更好地使用 AI 编程工具。当你知道 Token 消耗规则,就会优化 Prompt;当你理解上下文窗口限制,就会合理拆分任务;当你明白幻觉的存在,就会养成验证的习惯。