AI工作流核心概念整理
AI工作流核心概念整理
一、概念分类与定义
1. 配置文件类
CLAUDE.md
- 定义:Claude Code的核心配置文件,用于定义项目或用户的开发规范、工具链配置和代码风格指南。它是Claude Code在开始对话或执行任务时自动加载的上下文文件,帮助模型更好地理解项目的特定需求和规则。
- 核心内容:常用命令、代码风格指南、测试说明、仓库规范、开发环境设置、项目特有行为等。
- 文件位置:项目根目录、父目录(Monorepo结构)、用户主目录(全局配置)。
AGENTS.md
- 定义:一种开放的、基于Markdown的规范,用于为AI编码助手记录项目特定的指令。它是写给AI的项目说明书,补充README.md中可能对人类开发者不重要但对AI至关重要的技术细节。
- 核心原则:Agent-focused(为自动化工具提供详细技术指令)、Complements README.md(不替代人类文档,而是添加Agent特定的上下文)、Standardized location(放置在仓库根目录)、Open format(使用标准Markdown,结构灵活)、Ecosystem compatibility(适用于20多种AI编码工具和代理)。
- 关键内容:项目概述、设置命令、开发工作流、测试说明、代码风格指南、构建和部署等。
constitution.md
- 定义:项目的“宪法”,定义项目的治理原则、技术栈、开发准则等元规则,为整个项目设定“游戏规则”,让AI了解项目的技术约束和风格偏好,作为所有后续决策的基础。
- 核心内容:技术栈、开发准则、架构原则、安全准则等。
spec.md
- 定义:规格文档,聚焦于“做什么”和“为什么做”,从用户价值出发,清晰定义功能边界和验收标准。它是AI时代的精确化产品需求文档(PRD),将模糊的自然语言需求转化为结构化的上下文信息。
- 核心原则:只关注“What”和“Why”,不涉及“How”。
- 关键内容:目标、用户和背景、核心功能和用户故事、验收标准、工作流程、限制和范围外等。
plan.md
- 定义:技术设计文档,将用户需求转化为技术实现方案,包括API设计、模块交互和架构决策。它定义“怎么做”,为AI提供技术上下文。
- 核心内容:实现步骤、技术架构、数据模型、技术决策等。
task.md
- 定义:任务清单,将技术蓝图分解为可执行的编码任务,为AI提供明确的工作指令。它把宏观设计分解为微观、可执行的编码步骤,并明确关联到spec.md中的具体需求点。
- 核心特点:任务的原子性和可执行性,每个任务都应是离散、可管理的编码步骤。
2. 开发方法类
TDD(测试驱动开发)
- 定义:一种软件开发方法,强调在实现功能之前先编写测试用例,通过测试来驱动开发过程。在AI工作流中,TDD从单纯的验证手段演变为最高效的“提示工程”形式,为AI提供精确、无歧义的指令。
- 核心流程:红(编写失败的测试)- 绿(编写通过测试的代码)- 重构(优化代码)。
- 优势:消除需求歧义、提供回归安全网、简化调试过程、提升代码质量和可维护性。
3. 命令与交互类
/review指令
- 定义:一种AI工作流中的评审指令,通过迭代的“提问-回答-评审”过程来合成多轮对话,引入结构化的反馈机制,提升指令的多样性和难度。
- 核心角色:候选者(负责回答)、多个评论者(负责评估回答)、主席(负责合成新的后续指令)。
- 应用场景:代码审查、需求评审、文档审核等。
Slash Commands(斜杠命令)
- 定义:一种快速操作AI的方式,通过“/命令名 [参数]”的格式快速调用固定的操作或Prompt模板。它是命令化的Prompt模板系统,让AI助手能够快速执行复杂的AI操作。
- 核心类型:内置命令(如/clear、/compact、/init)和自定义命令(如/review-pr、/test)。
- 优势:提高输入效率、实现团队操作规范一致、可与外部工具联动、实现Prompt复用。
4. 安全与控制类
权限控制与沙河
- 定义:在AI工作流中,通过权限模型和沙箱机制对AI的操作进行控制和限制,确保AI只能执行授权范围内的操作,防止安全风险和数据泄露。
- 核心模型:RBAC(基于角色的访问控制),通过定义不同角色的权限来实现细粒度的访问控制。
- 沙箱机制:限制AI对系统资源的访问,如文件系统、网络、命令执行等,防止AI执行危险操作。
5. 工作流管理类
Checkpointing(检查点)
- 定义:在AI工作流中,定期保存工作流的状态快照,以便在出现故障或中断时能够恢复到最近的检查点,避免工作丢失。它是实现工作流可靠性和可恢复性的关键机制。
- 核心作用:断点续训、模型选择、模型微调与迁移学习、模型版本管理、故障排查与实验复现。
- 实现方式:通过将工作流状态序列化并存储到持久化存储(如数据库、文件系统)中。
Hooks机制
- 定义:一种事件驱动的自动化方案,能够让AI在关键节点自动触发响应动作,实现从“用户调用”到“事件触发”的自动化转变。它是AI生命周期中的“拦截器”,允许开发者在既定流程中挂入自定义代码。
- 核心事件:BeforeAgent(AI开始思考前)、BeforeModel(模型调用前)、AfterModel(模型返回后)、BeforeTool(工具调用前)、AfterTool(工具执行后)、AfterAgent(交互轮次结束后)。
- 应用场景:上下文注入、提示词改写、内容审核、安全沙箱、结果脱敏、异步操作等。
6. 外部集成类
连接MCP服务
- 定义:通过模型上下文协议(Model Context Protocol,MCP)连接外部工具和服务,扩展AI的能力边界。MCP是AI领域的“USB-C接口”,允许任何支持MCP的AI模型与任何符合MCP规范的工具或服务进行即插即用的交互。
- 核心组件:MCP Host(AI应用)、MCP Client(通信模块)、MCP Server(外部系统访问权限提供方)、MCP服务端托管平台(应用市场)。
- 工作流程:初始化、工具发现、工具调用。
7. 智能体能力类
Agent Skills(代理技能)
- 定义:模块化的能力包,包含指令、元数据和可选资源(脚本、模板),让AI Agent在需要时自动加载和使用。它是算法模型、场景数据与业务需求的深度融合体,贯穿Agent感知、决策、执行、学习全流程。
- 核心特点:渐进式加载(节省上下文空间)、可执行代码(包含实际可运行的脚本)、可组合性(多个Skill可以同时使用)、可移植性(在不同平台使用)。
- 关键类型:基础交互技能、决策规划技能、执行操作技能、学习进化技能。
Subagent(子代理)
- 定义:多智能体系统中承担特定子任务的独立执行单元,由主智能体创建和调度,专注于完成明确定义的子任务,并将结果返回给主智能体进行汇总。它是任务拆解与分工的产物,具有独立的推理能力和执行循环。
- 核心优势:任务并行化、专业分工、容错与韧性、可扩展性。
- 关键类型:研究型、创作型、执行型、审核型、协调型Subagent。
8. 部署与运行类
headless模式(无头模式)
- 定义:允许应用程序在没有图形界面的情况下运行的架构模式,特别适用于自动化场景、CI/CD流水线和系统集成。在AI工作流中,headless模式让AI能够以编程方式运行,无需交互式UI。
- 核心类型:命令行接口(CLI)模式、HTTP API模式、RPC模式、事件流模式。
- 应用场景:自动化脚本、CI/CD流水线、远程控制、系统集成等。
二、概念关系梳理
1. 层级结构
1 | AI工作流核心概念 |
2. 协同关系
配置文件类之间的协同:
- constitution.md作为项目的顶层规则,为spec.md、plan.md和task.md提供基础约束。
- spec.md定义“做什么”,plan.md定义“怎么做”,task.md将plan.md中的技术方案拆解为可执行的任务。
- CLAUDE.md和AGENTS.md为AI提供项目特定的指令和规范,帮助AI更好地理解项目上下文。
开发方法与其他概念的协同:
- TDD与配置文件类协同,通过测试用例驱动开发,确保AI生成的代码符合spec.md中定义的需求。
- TDD与Hooks机制协同,通过在测试执行前后触发Hooks,实现自动化测试和结果验证。
命令与交互类的协同:
- /review指令与Slash Commands协同,将评审功能封装为Slash Command,方便快速调用。
- Slash Commands与Agent Skills协同,将常用的技能封装为Slash Command,提高使用效率。
安全与控制类的协同:
- 权限控制与Hooks机制协同,通过在BeforeTool事件中检查权限,实现对工具调用的安全控制。
- 沙箱机制与MCP服务协同,限制AI对外部服务的访问权限,确保数据安全。
工作流管理类的协同:
- Checkpointing与Hooks机制协同,在关键节点自动保存检查点,实现工作流的可恢复性。
- Hooks机制与MCP服务协同,在MCP服务调用前后触发Hooks,实现对外部服务调用的监控和控制。
外部集成类的协同:
- 连接MCP服务与Agent Skills协同,通过MCP服务扩展Agent Skills的能力,实现与外部工具的集成。
- 连接MCP服务与Subagent协同,让Subagent能够通过MCP服务调用外部工具,完成复杂任务。
智能体能力类的协同:
- Agent Skills与Subagent协同,Subagent可以加载和使用Agent Skills,提高任务执行效率。
- Subagent与MCP服务协同,Subagent通过MCP服务调用外部工具,扩展自身能力。
部署与运行类的协同:
- headless模式与Slash Commands协同,通过Slash Commands在headless模式下控制AI的行为。
- headless模式与Checkpointing协同,在headless模式下自动保存检查点,实现工作流的可靠性。
三、应用场景举例
1. CLAUDE.md
- 场景1:团队协作开发时,通过CLAUDE.md定义统一的代码风格和开发规范,确保团队成员的代码风格一致。
- 场景2:个人开发者使用CLAUDE.md记录常用命令和工具链配置,提高开发效率。
2. AGENTS.md
- 场景1:开源项目中,通过AGENTS.md为AI编码助手提供项目特定的指令,帮助AI更好地理解项目结构和开发流程。
- 场景2:企业内部项目中,通过AGENTS.md定义项目的技术栈、开发准则和部署流程,确保AI生成的代码符合企业标准。
3. constitution.md
- 场景1:新项目初始化时,通过constitution.md定义项目的技术栈、架构原则和安全准则,为项目设定“游戏规则”。
- 场景2:项目迭代时,通过更新constitution.md来调整项目的技术栈和开发准则,适应项目的发展需求。
4. spec.md
- 场景1:产品需求分析时,通过spec.md定义产品的功能需求、验收标准和边界条件,确保开发团队对需求的理解一致。
- 场景2:AI生成代码时,通过spec.md为AI提供精确的需求描述,减少AI的幻觉和误解。
5. plan.md
- 场景1:技术设计阶段,通过plan.md定义项目的技术架构、模块交互和实现方案,为开发团队提供技术指导。
- 场景2:AI生成代码时,通过plan.md为AI提供技术实现方案,指导AI生成符合架构要求的代码。
6. task.md
- 场景1:项目开发时,通过task.md将项目拆解为可执行的任务,分配给开发团队成员,提高项目管理效率。
- 场景2:AI生成代码时,通过task.md为AI提供可执行的任务列表,指导AI按步骤完成代码生成。
7. TDD
- 场景1:开发新功能时,先编写测试用例,再实现功能,确保功能符合需求,提高代码质量。
- 场景2:AI生成代码时,通过TDD为AI提供精确的测试用例,验证AI生成的代码是否符合需求。
8. /review指令
- 场景1:代码审查时,通过/review指令让AI自动审查代码,提供审查建议,提高代码审查效率。
- 场景2:文档审核时,通过/review指令让AI自动审核文档,检查文档的准确性和完整性。
9. Slash Commands
- 场景1:日常开发中,通过Slash Commands快速调用常用操作,如代码生成、测试运行、文档生成等,提高开发效率。
- 场景2:团队协作中,通过Slash Commands实现团队操作规范一致,如代码审查、合并请求等。
10. 权限控制与沙河
- 场景1:企业内部AI应用中,通过权限控制确保不同角色的用户只能访问授权范围内的资源,保护企业数据安全。
- 场景2:公共AI服务中,通过沙箱机制限制AI对系统资源的访问,防止AI执行危险操作,保护用户隐私。
11. Checkpointing
- 场景1:大模型训练时,通过Checkpointing定期保存模型状态,实现断点续训,避免训练中断导致的工作丢失。
- 场景2:AI工作流执行时,通过Checkpointing保存工作流状态,实现工作流的可恢复性,提高工作流的可靠性。
12. Hooks机制
- 场景1:代码生成时,通过BeforeModel Hook注入实时项目上下文,如当前时间、用户信息等,提高代码生成的准确性。
- 场景2:工具调用时,通过BeforeTool Hook检查权限,防止AI执行未授权的操作,确保系统安全。
13. 连接MCP服务
- 场景1:AI应用中,通过MCP服务连接外部工具,如数据库、API、文件系统等,扩展AI的能力边界。
- 场景2:智能体系统中,通过MCP服务实现不同智能体之间的通信和协作,提高系统的整体能力。
14. Agent Skills
- 场景1:代码开发时,通过加载代码审查Skill,让AI自动审查代码,提供审查建议,提高代码质量。
- 场景2:文档生成时,通过加载文档生成Skill,让AI自动生成符合规范的文档,提高文档生成效率。
15. Subagent
- 场景1:复杂项目开发时,通过Subagent将项目拆解为多个子任务,分配给不同的Subagent执行,提高开发效率。
- 场景2:多智能体系统中,通过Subagent实现任务的并行执行,提高系统的处理能力。
16. headless模式
- 场景1:CI/CD流水线中,通过headless模式让AI自动执行代码审查、测试运行、部署等任务,实现自动化部署。
- 场景2:远程控制中,通过headless模式让AI在远程服务器上执行任务,实现远程管理和控制。
四、术语标准化
1. 通用术语
- AI工作流:指AI在执行任务时的一系列步骤和流程,包括需求分析、规划、执行、监控等。
- 智能体(Agent):一种能够自主感知环境、做出决策并执行动作的AI实体,具有自主学习和适应能力。
- 子代理(Subagent):由主智能体创建和调度的独立执行单元,专注于完成特定的子任务。
- 技能(Skill):智能体为完成特定任务而具备的能力集合,是算法模型、场景数据与业务需求的深度融合体。
- 检查点(Checkpoint):定期保存的工作流状态快照,用于在故障或中断时恢复工作流。
- 钩子(Hook):在AI生命周期的关键节点触发的自定义行为,用于实现对AI行为的拦截和控制。
- 模型上下文协议(MCP):一种用于连接AI模型与外部工具和服务的标准化协议,扩展AI的能力边界。
2. 特定术语
- CLAUDE.md:Claude Code的核心配置文件,用于定义项目或用户的开发规范和代码风格指南。
- AGENTS.md:一种开放的、基于Markdown的规范,用于为AI编码助手记录项目特定的指令。
- constitution.md:项目的“宪法”,定义项目的治理原则、技术栈、开发准则等元规则。
- spec.md:规格文档,聚焦于“做什么”和“为什么做”,定义功能边界和验收标准。
- plan.md:技术设计文档,定义“怎么做”,为AI提供技术实现方案。
- task.md:任务清单,将技术方案拆解为可执行的编码任务。
- TDD(测试驱动开发):一种软件开发方法,强调在实现功能之前先编写测试用例。
- /review指令:一种AI工作流中的评审指令,通过迭代的“提问-回答-评审”过程提升指令质量。
- Slash Commands(斜杠命令):一种快速操作AI的方式,通过“/命令名 [参数]”的格式快速调用固定操作或Prompt模板。
- 权限控制:通过定义不同角色的权限,实现对AI操作的细粒度控制。
- 沙箱机制:限制AI对系统资源的访问,防止AI执行危险操作。
- headless模式(无头模式):允许应用程序在没有图形界面的情况下运行的架构模式,适用于自动化场景和系统集成。
3. 歧义术语说明
- Agent:在AI工作流中,Agent通常指智能体,即能够自主执行任务的AI实体。但在某些上下文中,Agent也可能指代理服务器或代理程序。在AI工作流语境下,Agent通常指智能体。
- Skill:在AI工作流中,Skill通常指智能体的技能,即智能体为完成特定任务而具备的能力集合。但在某些上下文中,Skill也可能指技术技能或专业技能。在AI工作流语境下,Skill通常指智能体的技能。
- Checkpoint:在AI工作流中,Checkpoint通常指工作流的检查点,即定期保存的工作流状态快照。但在某些上下文中,Checkpoint也可能指模型检查点,即模型训练过程中定期保存的模型状态。在AI工作流语境下,Checkpoint通常指工作流的检查点。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Nosaw博客!
评论




