工具技能（SKILLS）：Superpowers · AI编程智能体技能框架详解

发表于： 2026年6月24日 2026年6月24日
标签： Prompt攻略

访问量： 77

文章目录

Superpowers · AI编程智能体技能框架详解

📊 项目概览

维度	数量	说明
技能数	14个	4类：Testing(1) + Debugging(2) + Collaboration(9) + Meta(2)
工作流	7步	头脑风暴→工作树→计划→子智能体开发→TDD→审查→完成
平台	11个	Claude Code/Codex/Cursor/Gemini CLI/Copilot CLI等
哲学	4条	测试驱动 / 系统化优于临时 / 复杂度削减 / 证据优于声称

🔥 核心价值：解决AI编程的10大痛点

痛点	Superpowers解决	技能
AI拿到需求直接写代码，方向错了白干	强制先头脑风暴→设计→批准才动手	brainstorming
AI写代码不写测试	强制RED-GREEN-REFACTOR，先写失败测试	test-driven-dev
AI声称”完成”但测试没跑	声称完成前必须运行验证命令	verification-before-completion
遇到bug直接猜修复，改A坏B	4阶段根因分析，禁止未找根因就修	systematic-debugging
多个独立问题串行处理	每个问题派发专用智能体并行	dispatching-parallel-agents
在主分支直接改代码	自动创建git worktree隔离	using-git-worktrees
写完代码没人审查	每任务后派审查子智能体	requesting-code-review
收到审查反馈无脑赞同	先技术评估再实现	receiving-code-review
一次性写大功能	拆解为2-5min小任务	writing-plans
功能写完不知道怎么收尾	验证→4选项→执行→清理	finishing-a-dev-branch

Superpowers · AI编程智能体技能框架详解

⚡ Superpowers · AI编程智能体技能框架详解

14个可组合技能 × 7步完整开发工作流 × 11个编程智能体平台

Superpowers 是一套完整的AI编程智能体软件开发方法论，由可组合的技能(Skills)构成，让AI编程助手从”写代码的打字员”进化为”遵循工程纪律的开发者”——先设计再编码、先测试再实现、先验证再交付

🔄 核心工作流：7步从想法到交付

💡 头脑风暴

brainstorming
先理解再动手

→

🌳 创建工作树

using-git-worktrees
隔离工作空间

→

📝 编写计划

writing-plans
拆解为2-5min小任务

→

🚀 子智能体驱动开发

subagent-driven-dev
每任务一个子智能体

→

🧪 测试驱动开发

test-driven-dev
RED→GREEN→REFACTOR

🔍 请求代码审查

requesting-code-review
每任务审查+终审

→

✅ 完成分支

finishing-a-dev-branch
验证→合并/PR/丢弃

智能体在每个任务前自动检查是否有技能适用——有1%可能就必须触发，这是强制工作流而非建议

📦 14个技能详解

Testing

🧪 test-driven-development

强制RED-GREEN-REFACTOR循环：先写失败测试→看它失败→写最小代码→看它通过→重构→提交。代码写在测试之前？删掉重来。

铁律：没有失败测试就没有生产代码。写代码前没测试？删除代码，从头来。

何时用：任何新功能/bug修复/重构/行为变更。唯一例外：一次性原型、生成代码、配置文件（需用户确认）

❌ “这次跳过TDD” → 停下，这是合理化借口
❌ 先写代码再补测试 → 删除代码重来
✅ 写测试→看失败→写最小代码→看通过→重构

Debugging

🔍 systematic-debugging

4阶段根因分析流程：①读错误信息 ②稳定复现 ③查最近变更 ④多组件边界插桩。禁止在未完成Phase 1前提出任何修复。

铁律：没有根因调查就没有修复。症状修复=失败。

何时用：任何bug/测试失败/异常行为/性能问题/构建失败。尤其当：时间紧迫(“快速修复”很诱人)、已经试了多次修复、上一个修复没生效

❌ “应该修好了” → 运行验证命令
❌ “只改一行就行” → 先找根因
✅ 读错误→复现→查变更→边界插桩→定位根因→修复→验证

Debugging

✅ verification-before-completion

在声称”完成”之前必须运行验证命令并确认输出。证据先于断言，永远如此。

铁律：没有新鲜验证证据就不能声称完成。本消息没运行验证命令就不能声称通过。

何时用：即将声称工作完成/修复成功/测试通过，提交或创建PR之前

❌ “应该可以了”/”我很有信心” → 信心≠证据
❌ “linter通过了” → linter≠编译器
✅ 运行完整测试→看到0失败→才能说”测试通过”

Collaboration

💡 brainstorming

苏格拉底式设计精炼：逐个提问理解意图→探索2-3种方案→分段展示设计→用户批准→写设计文档→自检→转入实现。硬门：不批准不写代码。

硬门：未展示设计并获得用户批准前，禁止调用任何实现技能、写任何代码、脚手架项目。

何时用：任何创造性工作之前——创建功能、构建组件、添加功能、修改行为。即使”太简单不需要设计”

❌ “太简单了直接写” → 简单项目未审视的假设浪费最多
✅ 理解上下文→逐个提问→2-3方案→分段设计→批准→设计文档→实现

Collaboration

📝 writing-plans

把设计拆解为2-5分钟的bite-sized任务，每个任务含精确文件路径、完整代码、验证步骤。假设执行者是”热情但品味差、无判断力、无项目上下文、讨厌测试的初级工程师”。

原则：DRY + YAGNI + TDD + 频繁提交。每步一个动作。禁止占位符(TBD/TODO/后续补充)。

何时用：有设计文档/需求规格后，写代码之前

❌ “TBD”/”TODO”/”添加适当错误处理” → 计划失败
❌ “类似Task N” → 重复代码（执行者可能乱序读）
✅ 精确路径+完整代码+精确命令+预期输出

Collaboration

🚀 subagent-driven-development

每个任务派发一个全新子智能体实现→两阶段审查(规格合规+代码质量)→下一个任务。子智能体不继承会话上下文——你精确构造它需要的。可连续工作数小时不偏离计划。

核心：新鲜子智能体/任务 + 任务审查(规格+质量) + 最终全分支审查 = 高质量快速迭代

何时用：有实现计划 + 任务基本独立 + 在当前会话中执行

❌ 任务间暂停问”继续吗？” → 用户让你执行计划就执行
✅ 派发子智能体→实现→审查→修复→下一个→最终审查→完成分支

Collaboration

⚡ dispatching-parallel-agents

面对2+个独立问题时，每个问题派发一个专用智能体并行处理。同一响应中多个派发=并行，逐个派发=串行。

核心：每个独立问题域一个智能体，并行运行。3个问题=1个问题的时间。

何时用：3+测试文件失败且根因不同、多个子系统独立故障。不用：故障关联(修一个可能修其他)、需要全局状态、智能体会互相干扰

Collaboration

📋 executing-plans

在独立会话中加载计划→批判性审查→逐任务执行→完成时调用finishing-a-development-branch。无人为中断点。

原则：先批判性审查计划→严格按步骤执行→不跳过验证→阻塞时停下问人

何时用：有实现计划但在独立会话中执行（无子智能体支持时）

Collaboration

🔍 requesting-code-review

派发代码审查子智能体，用精确构造的上下文（非会话历史）评估工作产物。两阶段：规格合规+代码质量。Critical问题阻塞进度。

核心：早审查、勤审查。子智能体驱动开发中每个任务后审查，合并前终审。

何时用：每个任务完成后、主要功能完成后、合并main前

Collaboration

📨 receiving-code-review

收到代码审查反馈时，先技术评估再实现。禁止表演性赞同(“你说得对！”/”好观点！”)，要求技术正确性而非社交舒适度。

核心：验证→实现。先问→再假设。技术正确性>社交舒适度。

何时用：收到代码审查反馈时，尤其是反馈看起来不清楚或技术上有疑问时

❌ “你说得对！”/”好观点！” → 表演性赞同，禁止
✅ 重述技术要求→澄清问题→技术反驳(如果错了)→逐项实现+测试

Collaboration

🌳 using-git-worktrees

确保工作在隔离空间进行：先检测是否已在worktree→优先用平台原生工具→回退git worktree。保护当前分支不受变更影响。

核心：先检测已有隔离→用原生工具→回退git。永远不与平台对抗。

何时用：开始需要与当前工作空间隔离的功能开发，或执行实现计划之前

Collaboration

🏁 finishing-a-development-branch

实现完成后：验证测试→检测环境→展示4选项(本地合并/创建PR/保留分支/丢弃)→执行选择→清理worktree。

核心：验证测试→检测环境→展示选项→执行选择→清理

何时用：实现完成、所有测试通过、需要决定如何集成工作时

Meta

⚡ using-superpowers

入口技能：建立如何发现和使用技能的规则。有1%可能适用就必须触发技能。技能优先级：用户指令>Superpowers技能>系统默认。

铁律：如果技能有1%可能适用，你必须触发它。这不是可选的，不是可协商的。

何时用：任何对话开始时——建立技能发现和触发规则

🎯 解决什么场景问题？

类别	场景痛点	Superpowers解决	核心技能	效果
🧭 方向	AI拿到需求直接写代码，方向错了白干几小时	强制先头脑风暴，理解意图→设计方案→用户批准才动手	brainstorming	从”写代码的打字员”→”理解需求的设计师”
🧭 方向	一次性写大功能，改到后面忘了前面改了什么	拆解为2-5min小任务，每任务独立可测可审查	writing-plans	大功能→bite-sized任务，每步可验证
🧪 质量	AI写代码不写测试，或先写代码后补测试(测试只验证已有代码)	强制RED-GREEN-REFACTOR，先写失败测试→最小实现→重构	test-driven-dev	测试真正验证行为，而非验证实现
🧪 质量	AI声称”完成了”但测试没跑/没通过	声称完成前必须运行验证命令并确认输出	verification-before-completion	杜绝”应该可以了”的虚假完成声明
🧪 质量	AI写完代码没人审查，问题累积到后期才发现	每任务后派发审查子智能体，两阶段审查(规格+质量)	requesting-code-review	问题在发生时被捕获，不累积
🐛 调试	AI遇到bug直接猜修复，改了A坏B，反复试错	4阶段根因分析：读错误→复现→查变更→边界插桩，禁止未找根因就修	systematic-debugging	一次修对，而非反复试错
🚀 效率	多个独立问题串行处理，浪费时间	每个独立问题域派发专用智能体并行处理	dispatching-parallel-agents	3个问题=1个问题的时间
🚀 效率	AI在主分支上直接改代码，搞坏了回不去	自动创建git worktree隔离工作空间	using-git-worktrees	主分支永远干净，实验在隔离空间
🤝 协作	收到审查反馈AI无脑赞同(“你说得对！”)然后实现错误建议	先技术评估再实现，禁止表演性赞同	receiving-code-review	技术正确性>社交舒适度
🤝 协作	功能写完不知道怎么收尾：合并？PR？还是先放着？	验证测试→展示4选项→执行选择→清理worktree	finishing-a-dev-branch	结构化完成流程，不遗漏

🏗️ 用Superpowers开发”电商平台订单导出功能”

📋 场景：用户要求”给电商平台加一个订单导出功能，支持CSV和Excel格式，大促期间百万级订单量”

Step 1

💡 头脑风暴 — brainstorming

brainstorming

AI不会直接写代码，而是先问：
① “导出的订单数据范围？全部/按时间/按状态？”
② “百万级是同步导出还是异步生成后下载？”
③ “Excel需要样式(合并单元格/分Sheet)还是纯数据？”
④ “是否需要导出权限控制？”
⑤ “导出失败(超时/数据不完整)怎么通知用户？”

然后提出2-3种方案：
方案A：同步导出(简单但大促超时风险高) 方案B：异步生成+通知下载(复杂但可扩展) 方案C：流式分批导出(折中)

用户批准方案B后，写设计文档到 docs/superpowers/specs/2026-06-23-order-export-design.md，自检(无占位符/无矛盾/无歧义)，用户确认后转入实现。

硬门：用户没批准前，一行代码都不写。

Step 2

🌳 创建工作树 — using-git-worktrees

using-git-worktrees

AI检测当前环境：GIT_DIR != GIT_COMMON？已在worktree→跳过。否则创建隔离工作空间：
git worktree add .worktrees/feat-order-export feat/order-export

在新分支 feat/order-export 上工作，主分支完全不受影响。如果实验失败，直接丢弃worktree，干干净净。

然后运行项目设置、验证测试基线(确保从干净状态开始)。

Step 3

📝 编写实现计划 — writing-plans

writing-plans

AI把设计拆解为2-5分钟的bite-sized任务，假设执行者是”热情但品味差、无上下文、讨厌测试的初级工程师”：

Task 1：导出任务模型 + 数据库迁移（写失败测试→看失败→写迁移→看通过→提交）
Task 2：导出任务创建API（写失败测试→看失败→写API→看通过→提交）
Task 3：CSV格式生成器（写失败测试→看失败→写生成器→看通过→提交）
Task 4：Excel格式生成器（写失败测试→看失败→写生成器→看通过→提交）
Task 5：异步任务调度+进度通知（写失败测试→看失败→写调度→看通过→提交）
Task 6：百万级分批流式导出（写失败测试→看失败→写流式→看通过→提交）
Task 7：导出权限+下载API（写失败测试→看失败→写权限→看通过→提交）
Task 8：集成测试+错误处理（写失败测试→看失败→写集成→看通过→提交）

每个Task含精确文件路径+完整代码+验证命令+预期输出，零占位符。
保存到 docs/superpowers/plans/2026-06-23-order-export.md

Step 4

🚀 子智能体驱动开发 — subagent-driven-development

subagent-driven-dev

每个Task派发一个全新子智能体，子智能体不继承主会话上下文——你精确构造它需要的：

Task 1：派发子智能体A → 实现导出任务模型+迁移 → 两阶段审查(规格合规+代码质量)
Task 2：派发子智能体B → 实现创建API → 审查 → Critical问题派修复子智能体 → 再审查
Task 3：派发子智能体C → 实现CSV生成器 → 审查
…连续执行所有8个任务，不暂停问”继续吗？”

关键：子智能体在实现时自动遵循TDD(下一个技能)，所以每个Task内部是：
写失败测试 → 看失败 → 写最小代码 → 看通过 → 提交

全部任务完成后，派发最终代码审查子智能体做全分支审查。

Step 5

🧪 测试驱动开发 — test-driven-development

test-driven-dev

每个子智能体在实现Task时强制RED-GREEN-REFACTOR：

RED：写失败测试

test('export task creates with pending status', async () => {

      const task = await createExportTask({format:'csv', dateRange:'2026-06'});

      expect(task.status).toBe('pending');

    });

运行 → FAIL(“createExportTask is not defined”) ✅ 正确的失败

GREEN：写最小代码让测试通过

async function createExportTask(opts) {

      return { id: uuid(), status: 'pending', ...opts };

    }

运行 → PASS ✅

REFACTOR：清理(提取常量、改善命名)→运行→仍PASS→提交

如果子智能体先写了代码再补测试？删除代码，从头来。

Step 6

🔍 请求代码审查 — requesting-code-review

requesting-code-review

每Task完成后派发审查子智能体，审查者拿到精确上下文(非会话历史)：

Task 3完成后：
BASE_SHA=a7981ec HEAD_SHA=3df7661
派发审查子智能体：”审查CSV生成器实现，规格见Task 3…”

审查结果：
✅ Strengths：流式写入、内存可控
⚠️ Important：缺少BOM头(Excel打开中文乱码)
⚡ Minor：magic number 8192(buffer size)

→ Important问题阻塞进度，派修复子智能体加BOM头 → 再审查 → 通过 → 继续

Step 7

🏁 完成分支 — finishing-a-development-branch

finishing-a-dev-branch

Step 1：验证测试 → npm test → 42/42 PASS ✅
Step 2：检测环境 → 在worktree中，命名分支 feat/order-export
Step 3：确定基分支 → main
Step 4：展示选项：
  1️⃣ 本地合并回 main
  2️⃣ 推送并创建Pull Request
  3️⃣ 保留分支(稍后处理)
  4️⃣ 丢弃此工作

用户选择 2️⃣ → 创建PR → 清理worktree → 完成！

补充

🐛 遇到bug时 — systematic-debugging + dispatching-parallel-agents

systematic-debugging dispatching-parallel-agents

开发过程中发现3个测试文件同时失败：
csv-export.test.ts：2个失败(编码问题)
excel-export.test.ts：1个失败(大数精度丢失)
task-scheduler.test.ts：3个失败(竞态条件)

systematic-debugging：每个问题先4阶段根因分析——读错误→复现→查变更→边界插桩，禁止未找根因就修

dispatching-parallel-agents：3个问题独立→派发3个子智能体并行调查：
子智能体A修csv编码 → 子智能体B修excel精度 → 子智能体C修竞态条件
3个问题=1个问题的时间，而非串行3倍时间

🧠 核心哲学

🧪

测试驱动开发

先写测试，永远如此。没看测试失败=不知道测试了正确的事。

📊

系统化优于临时

流程优于猜测。根因分析优于症状修复。计划优于即兴。

🎯

复杂度削减

简洁是首要目标。YAGNI(你不会需要它)。DRY(不要重复)。

🔬

证据优于声称

验证后才能声明成功。”应该可以了”=说谎，不是验证。

🌐 支持11个AI编程平台

Claude Code Antigravity Codex App Codex CLI Cursor Factory Droid Gemini CLI GitHub Copilot CLI Kimi Code OpenCode Pi

一句话总结：Superpowers 让AI编程智能体从“拿到需求就写代码”进化为“先理解再设计→先计划再实现→先测试再编码→先验证再交付”的工程纪律执行者。14个技能自动触发（有1%可能适用就必须触发），不是建议而是强制工作流。结果是：方向对、质量高、bug少、可验证、可审查、可交付。

技能链接

https://github.com/jnMetaCode/superpowers-zh

viplao

489