概念大全

Yd Wen2026/4/10大约 6 分钟

🎯 为什么需要了解这些概念

在学习 Vibe Coding 的过程中，会遇到各种陌生的名词和术语：Token、上下文窗口、RAG 等。这些概念听起来高大上，但理解起来并不难。掌握这些术语，能帮助你更好地理解 AI 编程工具的工作原理，从而更高效地使用它们。

📊 核心概念详解

Token（令牌/词元）

AI 处理文本的基本单位，可以是一个字、一个词，甚至是一个标点符号。

提示

你可以把 Token 想象成 AI 的"货币"。每次你和 AI 对话，都需要消耗 Token。Prompt（提示词）越长、生成的回复越长，消耗的 Token 就越多。

关键要点：

中文通常 1 个字 ≈ 1-2 个 Token
英文通常 1 个单词 ≈ 1-2 个 Token
Token 消耗直接关系到使用成本

上下文窗口（Context Window）

AI 能"记住"的上下文长度限制，也就是一次对话中 AI 能参考的最大 Token 数量。

提示

就像人的短期记忆一样，上下文窗口决定了 AI 能同时处理多少信息。窗口越大，AI 能参考的代码和对话历史就越多。

常见模型上下文窗口：

模型	上下文窗口
GPT-4	128K tokens
Claude 3	200K tokens
Gemini 1.5	1M+ tokens

应用场景：

小窗口：简单问答、单文件编辑
大窗口：整个代码库分析、长文档理解

Prompt（提示词）

你给 AI 的指令或问题，告诉 AI 你想要什么。

提示

Prompt 是 Vibe Coding 的核心技能。同样的需求，不同的 Prompt 质量，会得到完全不同的结果。

Prompt 优化原则：

清晰具体：明确说明想要什么
提供上下文：给 AI 足够的背景信息
使用示例：用例子说明期望的输出格式
分解任务：复杂任务拆分成小步骤

RAG（检索增强生成）

AI 在回答问题时，先从知识库中检索相关信息，再结合这些信息生成回答。

提示

就像开卷考试一样，RAG 让 AI 可以"查阅资料"后再回答，而不是仅凭记忆。这样回答更准确、更专业。

工作流程：

用户提问 → 检索相关知识 → 整合信息 → 生成回答

在 Vibe Coding 中的应用：

代码库智能问答
文档自动生成
基于私有代码的辅助编程

Agent（智能体）

能够自主规划、使用工具、完成复杂任务的 AI 系统。

提示

Agent 不只是回答问题，它能像人一样思考：理解任务 → 制定计划 → 执行步骤 → 检查结果 → 调整策略。

Agent 的核心能力：

自主规划：将复杂任务拆解为可执行步骤
工具调用：使用外部工具（如搜索、代码执行）
记忆管理：记住之前的操作和结果
错误处理：遇到问题能自我修正

代表产品：Claude Code、Cursor Agent Mode、GitHub Copilot Chat

MCP（Model Context Protocol）

模型上下文协议，让 AI 能够安全地连接外部工具和数据的开放标准。

提示

你可以把 MCP 想象成 AI 的"USB 接口"。通过这个标准接口，AI 可以连接各种外部服务（数据库、文件系统、API 等），大大扩展能力边界。

核心价值：

标准化：统一接口，降低集成成本
安全性：受控访问，保护数据安全
生态丰富：社区提供大量现成 MCP Server

幻觉（Hallucination）

AI 生成看似合理但实际错误的内容。

提示

AI 有时候会"一本正经地胡说八道"。它可能引用不存在的函数、生成错误的代码逻辑，或者编造不存在的文档。这是使用 AI 时必须警惕的问题。

应对策略：

人工验证关键代码
要求 AI 提供参考来源
分步骤验证，及时纠错
对不确定的信息进行二次确认

温度（Temperature）

控制 AI 输出随机性的参数，范围通常为 0-2。

提示

温度越低，AI 越"保守"，输出越确定、越严谨；温度越高，AI 越"有创意"，输出越多样、越随机。

参数选择建议：

温度值	适用场景
0.0-0.3	代码生成、数学计算（需要精确）
0.5-0.7	一般对话、内容创作（平衡）
0.8-1.2	头脑风暴、创意写作（需要多样性）

嵌入（Embedding）

将文本、代码等内容转换成向量（数字数组），用于语义搜索和相似度计算。

提示

嵌入让 AI 能理解"意思相近"的内容。比如"苹果"和"水果"在向量空间中距离很近，这样 AI 就能找到相关的代码片段或文档。

应用场景：

代码库语义搜索
相似代码推荐
文档智能分类

微调（Fine-tuning）

在预训练模型的基础上，用特定领域的数据进一步训练，让模型更擅长特定任务。

提示

就像通用医生进修专科一样，微调让通用 AI 模型变成特定领域的专家（如专门写 Python、专门理解你的代码库）。

适用情况：

有特定代码规范需要遵循
需要理解私有领域知识
追求极致的代码生成质量

多模态（Multimodal）

AI 能同时理解和处理多种类型的数据（文本、图片、音频、视频）。

提示

多模态让 AI 不仅能读代码，还能看懂设计图、理解界面截图、甚至分析视频演示。这大大扩展了 Vibe Coding 的可能性。

应用场景：

根据设计图生成前端代码
截图报错信息让 AI 诊断
语音描述需求直接生成代码

🔧 概念关系图

Vibe Coding 核心概念关系

Prompt（提示词）
    ↓
Token（基本单位） ←→ 上下文窗口（记忆限制）
    ↓
Agent（智能执行） ←→ MCP（工具连接）
    ↓
RAG（知识增强） ←→ 嵌入（语义理解）
    ↓
生成结果 ←→ 幻觉（质量风险）
    ↓
微调（优化）/ 温度（调节）/ 多模态（扩展）

⚔️ 概念对比表

概念 A	概念 B	区别
Token	上下文窗口	Token 是单位，上下文窗口是容量上限
Prompt	上下文	Prompt 是输入，上下文包含对话历史
RAG	微调	RAG 是动态检索，微调是静态训练
Agent	传统 AI	Agent 能自主执行，传统 AI 仅响应
温度	Top-p	温度控制随机性，Top-p 控制多样性
嵌入	关键词	嵌入理解语义，关键词匹配字面

💡 实用记忆技巧

概念	记忆口诀
Token	"AI 的货币，按量计费"
上下文窗口	"短期记忆，容量有限"
RAG	"开卷考试，有据可查"
Agent	"智能代理，自主执行"
幻觉	"AI 说胡话，需要核实"
温度	"低温严谨，高温创意"
MCP	"USB 接口，即插即用"

🌟 核心要点总结

提示

理解这些概念不是为了背定义，而是为了更好地使用 AI 编程工具。当你知道 Token 消耗规则，就会优化 Prompt；当你理解上下文窗口限制，就会合理拆分任务；当你明白幻觉的存在，就会养成验证的习惯。

📚 参考资料

Vibe Coding 概念大全