AI工作流核心概念整理

一、概念分类与定义

1. 配置文件类

CLAUDE.md

定义：Claude Code的核心配置文件，用于定义项目或用户的开发规范、工具链配置和代码风格指南。它是Claude Code在开始对话或执行任务时自动加载的上下文文件，帮助模型更好地理解项目的特定需求和规则。
核心内容：常用命令、代码风格指南、测试说明、仓库规范、开发环境设置、项目特有行为等。
文件位置：项目根目录、父目录（Monorepo结构）、用户主目录（全局配置）。

AGENTS.md

定义：一种开放的、基于Markdown的规范，用于为AI编码助手记录项目特定的指令。它是写给AI的项目说明书，补充README.md中可能对人类开发者不重要但对AI至关重要的技术细节。
核心原则：Agent-focused（为自动化工具提供详细技术指令）、Complements README.md（不替代人类文档，而是添加Agent特定的上下文）、Standardized location（放置在仓库根目录）、Open format（使用标准Markdown，结构灵活）、Ecosystem compatibility（适用于20多种AI编码工具和代理）。
关键内容：项目概述、设置命令、开发工作流、测试说明、代码风格指南、构建和部署等。

constitution.md

定义：项目的“宪法”，定义项目的治理原则、技术栈、开发准则等元规则，为整个项目设定“游戏规则”，让AI了解项目的技术约束和风格偏好，作为所有后续决策的基础。
核心内容：技术栈、开发准则、架构原则、安全准则等。

spec.md

定义：规格文档，聚焦于“做什么”和“为什么做”，从用户价值出发，清晰定义功能边界和验收标准。它是AI时代的精确化产品需求文档（PRD），将模糊的自然语言需求转化为结构化的上下文信息。
核心原则：只关注“What”和“Why”，不涉及“How”。
关键内容：目标、用户和背景、核心功能和用户故事、验收标准、工作流程、限制和范围外等。

plan.md

定义：技术设计文档，将用户需求转化为技术实现方案，包括API设计、模块交互和架构决策。它定义“怎么做”，为AI提供技术上下文。
核心内容：实现步骤、技术架构、数据模型、技术决策等。

task.md

定义：任务清单，将技术蓝图分解为可执行的编码任务，为AI提供明确的工作指令。它把宏观设计分解为微观、可执行的编码步骤，并明确关联到spec.md中的具体需求点。
核心特点：任务的原子性和可执行性，每个任务都应是离散、可管理的编码步骤。

2. 开发方法类

TDD（测试驱动开发）

定义：一种软件开发方法，强调在实现功能之前先编写测试用例，通过测试来驱动开发过程。在AI工作流中，TDD从单纯的验证手段演变为最高效的“提示工程”形式，为AI提供精确、无歧义的指令。
核心流程：红（编写失败的测试）- 绿（编写通过测试的代码）- 重构（优化代码）。
优势：消除需求歧义、提供回归安全网、简化调试过程、提升代码质量和可维护性。

3. 命令与交互类

/review指令

定义：一种AI工作流中的评审指令，通过迭代的“提问-回答-评审”过程来合成多轮对话，引入结构化的反馈机制，提升指令的多样性和难度。
核心角色：候选者（负责回答）、多个评论者（负责评估回答）、主席（负责合成新的后续指令）。
应用场景：代码审查、需求评审、文档审核等。

Slash Commands（斜杠命令）

定义：一种快速操作AI的方式，通过“/命令名 [参数]”的格式快速调用固定的操作或Prompt模板。它是命令化的Prompt模板系统，让AI助手能够快速执行复杂的AI操作。
核心类型：内置命令（如/clear、/compact、/init）和自定义命令（如/review-pr、/test）。
优势：提高输入效率、实现团队操作规范一致、可与外部工具联动、实现Prompt复用。

4. 安全与控制类

权限控制与沙河

定义：在AI工作流中，通过权限模型和沙箱机制对AI的操作进行控制和限制，确保AI只能执行授权范围内的操作，防止安全风险和数据泄露。
核心模型：RBAC（基于角色的访问控制），通过定义不同角色的权限来实现细粒度的访问控制。
沙箱机制：限制AI对系统资源的访问，如文件系统、网络、命令执行等，防止AI执行危险操作。

5. 工作流管理类

Checkpointing（检查点）

定义：在AI工作流中，定期保存工作流的状态快照，以便在出现故障或中断时能够恢复到最近的检查点，避免工作丢失。它是实现工作流可靠性和可恢复性的关键机制。
核心作用：断点续训、模型选择、模型微调与迁移学习、模型版本管理、故障排查与实验复现。
实现方式：通过将工作流状态序列化并存储到持久化存储（如数据库、文件系统）中。

Hooks机制

定义：一种事件驱动的自动化方案，能够让AI在关键节点自动触发响应动作，实现从“用户调用”到“事件触发”的自动化转变。它是AI生命周期中的“拦截器”，允许开发者在既定流程中挂入自定义代码。
核心事件：BeforeAgent（AI开始思考前）、BeforeModel（模型调用前）、AfterModel（模型返回后）、BeforeTool（工具调用前）、AfterTool（工具执行后）、AfterAgent（交互轮次结束后）。
应用场景：上下文注入、提示词改写、内容审核、安全沙箱、结果脱敏、异步操作等。

6. 外部集成类

连接MCP服务

定义：通过模型上下文协议（Model Context Protocol，MCP）连接外部工具和服务，扩展AI的能力边界。MCP是AI领域的“USB-C接口”，允许任何支持MCP的AI模型与任何符合MCP规范的工具或服务进行即插即用的交互。
核心组件：MCP Host（AI应用）、MCP Client（通信模块）、MCP Server（外部系统访问权限提供方）、MCP服务端托管平台（应用市场）。
工作流程：初始化、工具发现、工具调用。

7. 智能体能力类

Agent Skills（代理技能）

定义：模块化的能力包，包含指令、元数据和可选资源（脚本、模板），让AI Agent在需要时自动加载和使用。它是算法模型、场景数据与业务需求的深度融合体，贯穿Agent感知、决策、执行、学习全流程。
核心特点：渐进式加载（节省上下文空间）、可执行代码（包含实际可运行的脚本）、可组合性（多个Skill可以同时使用）、可移植性（在不同平台使用）。
关键类型：基础交互技能、决策规划技能、执行操作技能、学习进化技能。

Subagent（子代理）

定义：多智能体系统中承担特定子任务的独立执行单元，由主智能体创建和调度，专注于完成明确定义的子任务，并将结果返回给主智能体进行汇总。它是任务拆解与分工的产物，具有独立的推理能力和执行循环。
核心优势：任务并行化、专业分工、容错与韧性、可扩展性。
关键类型：研究型、创作型、执行型、审核型、协调型Subagent。

8. 部署与运行类

headless模式（无头模式）

定义：允许应用程序在没有图形界面的情况下运行的架构模式，特别适用于自动化场景、CI/CD流水线和系统集成。在AI工作流中，headless模式让AI能够以编程方式运行，无需交互式UI。
核心类型：命令行接口（CLI）模式、HTTP API模式、RPC模式、事件流模式。
应用场景：自动化脚本、CI/CD流水线、远程控制、系统集成等。

二、概念关系梳理

1. 层级结构

AI工作流核心概念
├── 配置文件类
│   ├── CLAUDE.md
│   ├── AGENTS.md
│   ├── constitution.md
│   ├── spec.md
│   ├── plan.md
│   └── task.md
├── 开发方法类
│   └── TDD
├── 命令与交互类
│   ├── /review指令
│   └── Slash Commands
├── 安全与控制类
│   └── 权限控制与沙河
├── 工作流管理类
│   ├── Checkpointing
│   └── Hooks机制
├── 外部集成类
│   └── 连接MCP服务
├── 智能体能力类
│   ├── Agent Skills
│   └── Subagent
└── 部署与运行类
    └── headless模式

2. 协同关系

配置文件类之间的协同：
- constitution.md作为项目的顶层规则，为spec.md、plan.md和task.md提供基础约束。
- spec.md定义“做什么”，plan.md定义“怎么做”，task.md将plan.md中的技术方案拆解为可执行的任务。
- CLAUDE.md和AGENTS.md为AI提供项目特定的指令和规范，帮助AI更好地理解项目上下文。
开发方法与其他概念的协同：
- TDD与配置文件类协同，通过测试用例驱动开发，确保AI生成的代码符合spec.md中定义的需求。
- TDD与Hooks机制协同，通过在测试执行前后触发Hooks，实现自动化测试和结果验证。
命令与交互类的协同：
- /review指令与Slash Commands协同，将评审功能封装为Slash Command，方便快速调用。
- Slash Commands与Agent Skills协同，将常用的技能封装为Slash Command，提高使用效率。
安全与控制类的协同：
- 权限控制与Hooks机制协同，通过在BeforeTool事件中检查权限，实现对工具调用的安全控制。
- 沙箱机制与MCP服务协同，限制AI对外部服务的访问权限，确保数据安全。
工作流管理类的协同：
- Checkpointing与Hooks机制协同，在关键节点自动保存检查点，实现工作流的可恢复性。
- Hooks机制与MCP服务协同，在MCP服务调用前后触发Hooks，实现对外部服务调用的监控和控制。
外部集成类的协同：
- 连接MCP服务与Agent Skills协同，通过MCP服务扩展Agent Skills的能力，实现与外部工具的集成。
- 连接MCP服务与Subagent协同，让Subagent能够通过MCP服务调用外部工具，完成复杂任务。
智能体能力类的协同：
- Agent Skills与Subagent协同，Subagent可以加载和使用Agent Skills，提高任务执行效率。
- Subagent与MCP服务协同，Subagent通过MCP服务调用外部工具，扩展自身能力。
部署与运行类的协同：
- headless模式与Slash Commands协同，通过Slash Commands在headless模式下控制AI的行为。
- headless模式与Checkpointing协同，在headless模式下自动保存检查点，实现工作流的可靠性。

三、应用场景举例

1. CLAUDE.md

场景1：团队协作开发时，通过CLAUDE.md定义统一的代码风格和开发规范，确保团队成员的代码风格一致。
场景2：个人开发者使用CLAUDE.md记录常用命令和工具链配置，提高开发效率。

2. AGENTS.md

场景1：开源项目中，通过AGENTS.md为AI编码助手提供项目特定的指令，帮助AI更好地理解项目结构和开发流程。
场景2：企业内部项目中，通过AGENTS.md定义项目的技术栈、开发准则和部署流程，确保AI生成的代码符合企业标准。

3. constitution.md

场景1：新项目初始化时，通过constitution.md定义项目的技术栈、架构原则和安全准则，为项目设定“游戏规则”。
场景2：项目迭代时，通过更新constitution.md来调整项目的技术栈和开发准则，适应项目的发展需求。

4. spec.md

场景1：产品需求分析时，通过spec.md定义产品的功能需求、验收标准和边界条件，确保开发团队对需求的理解一致。
场景2：AI生成代码时，通过spec.md为AI提供精确的需求描述，减少AI的幻觉和误解。

5. plan.md

场景1：技术设计阶段，通过plan.md定义项目的技术架构、模块交互和实现方案，为开发团队提供技术指导。
场景2：AI生成代码时，通过plan.md为AI提供技术实现方案，指导AI生成符合架构要求的代码。

6. task.md

场景1：项目开发时，通过task.md将项目拆解为可执行的任务，分配给开发团队成员，提高项目管理效率。
场景2：AI生成代码时，通过task.md为AI提供可执行的任务列表，指导AI按步骤完成代码生成。

7. TDD

场景1：开发新功能时，先编写测试用例，再实现功能，确保功能符合需求，提高代码质量。
场景2：AI生成代码时，通过TDD为AI提供精确的测试用例，验证AI生成的代码是否符合需求。

8. /review指令

场景1：代码审查时，通过/review指令让AI自动审查代码，提供审查建议，提高代码审查效率。
场景2：文档审核时，通过/review指令让AI自动审核文档，检查文档的准确性和完整性。

9. Slash Commands

场景1：日常开发中，通过Slash Commands快速调用常用操作，如代码生成、测试运行、文档生成等，提高开发效率。
场景2：团队协作中，通过Slash Commands实现团队操作规范一致，如代码审查、合并请求等。

10. 权限控制与沙河

场景1：企业内部AI应用中，通过权限控制确保不同角色的用户只能访问授权范围内的资源，保护企业数据安全。
场景2：公共AI服务中，通过沙箱机制限制AI对系统资源的访问，防止AI执行危险操作，保护用户隐私。

11. Checkpointing

场景1：大模型训练时，通过Checkpointing定期保存模型状态，实现断点续训，避免训练中断导致的工作丢失。
场景2：AI工作流执行时，通过Checkpointing保存工作流状态，实现工作流的可恢复性，提高工作流的可靠性。

12. Hooks机制

场景1：代码生成时，通过BeforeModel Hook注入实时项目上下文，如当前时间、用户信息等，提高代码生成的准确性。
场景2：工具调用时，通过BeforeTool Hook检查权限，防止AI执行未授权的操作，确保系统安全。

13. 连接MCP服务

场景1：AI应用中，通过MCP服务连接外部工具，如数据库、API、文件系统等，扩展AI的能力边界。
场景2：智能体系统中，通过MCP服务实现不同智能体之间的通信和协作，提高系统的整体能力。

14. Agent Skills

场景1：代码开发时，通过加载代码审查Skill，让AI自动审查代码，提供审查建议，提高代码质量。
场景2：文档生成时，通过加载文档生成Skill，让AI自动生成符合规范的文档，提高文档生成效率。

15. Subagent

场景1：复杂项目开发时，通过Subagent将项目拆解为多个子任务，分配给不同的Subagent执行，提高开发效率。
场景2：多智能体系统中，通过Subagent实现任务的并行执行，提高系统的处理能力。

16. headless模式

场景1：CI/CD流水线中，通过headless模式让AI自动执行代码审查、测试运行、部署等任务，实现自动化部署。
场景2：远程控制中，通过headless模式让AI在远程服务器上执行任务，实现远程管理和控制。

四、术语标准化

1. 通用术语

AI工作流：指AI在执行任务时的一系列步骤和流程，包括需求分析、规划、执行、监控等。
智能体（Agent）：一种能够自主感知环境、做出决策并执行动作的AI实体，具有自主学习和适应能力。
子代理（Subagent）：由主智能体创建和调度的独立执行单元，专注于完成特定的子任务。
技能（Skill）：智能体为完成特定任务而具备的能力集合，是算法模型、场景数据与业务需求的深度融合体。
检查点（Checkpoint）：定期保存的工作流状态快照，用于在故障或中断时恢复工作流。
钩子（Hook）：在AI生命周期的关键节点触发的自定义行为，用于实现对AI行为的拦截和控制。
模型上下文协议（MCP）：一种用于连接AI模型与外部工具和服务的标准化协议，扩展AI的能力边界。

2. 特定术语

CLAUDE.md：Claude Code的核心配置文件，用于定义项目或用户的开发规范和代码风格指南。
AGENTS.md：一种开放的、基于Markdown的规范，用于为AI编码助手记录项目特定的指令。
constitution.md：项目的“宪法”，定义项目的治理原则、技术栈、开发准则等元规则。
spec.md：规格文档，聚焦于“做什么”和“为什么做”，定义功能边界和验收标准。
plan.md：技术设计文档，定义“怎么做”，为AI提供技术实现方案。
task.md：任务清单，将技术方案拆解为可执行的编码任务。
TDD（测试驱动开发）：一种软件开发方法，强调在实现功能之前先编写测试用例。
/review指令：一种AI工作流中的评审指令，通过迭代的“提问-回答-评审”过程提升指令质量。
Slash Commands（斜杠命令）：一种快速操作AI的方式，通过“/命令名 [参数]”的格式快速调用固定操作或Prompt模板。
权限控制：通过定义不同角色的权限，实现对AI操作的细粒度控制。
沙箱机制：限制AI对系统资源的访问，防止AI执行危险操作。
headless模式（无头模式）：允许应用程序在没有图形界面的情况下运行的架构模式，适用于自动化场景和系统集成。

3. 歧义术语说明

Agent：在AI工作流中，Agent通常指智能体，即能够自主执行任务的AI实体。但在某些上下文中，Agent也可能指代理服务器或代理程序。在AI工作流语境下，Agent通常指智能体。
Skill：在AI工作流中，Skill通常指智能体的技能，即智能体为完成特定任务而具备的能力集合。但在某些上下文中，Skill也可能指技术技能或专业技能。在AI工作流语境下，Skill通常指智能体的技能。
Checkpoint：在AI工作流中，Checkpoint通常指工作流的检查点，即定期保存的工作流状态快照。但在某些上下文中，Checkpoint也可能指模型检查点，即模型训练过程中定期保存的模型状态。在AI工作流语境下，Checkpoint通常指工作流的检查点。