Superpowers · AI编程智能体技能框架详解

📊 项目概览

维度数量说明
技能数14个4类:Testing(1) + Debugging(2) + Collaboration(9) + Meta(2)
工作流7步头脑风暴→工作树→计划→子智能体开发→TDD→审查→完成
平台11个Claude Code/Codex/Cursor/Gemini CLI/Copilot CLI等
哲学4条测试驱动 / 系统化优于临时 / 复杂度削减 / 证据优于声称

🔥 核心价值:解决AI编程的10大痛点

痛点Superpowers解决技能
AI拿到需求直接写代码,方向错了白干强制先头脑风暴→设计→批准才动手brainstorming
AI写代码不写测试强制RED-GREEN-REFACTOR,先写失败测试test-driven-dev
AI声称”完成”但测试没跑声称完成前必须运行验证命令verification-before-completion
遇到bug直接猜修复,改A坏B4阶段根因分析,禁止未找根因就修systematic-debugging
多个独立问题串行处理每个问题派发专用智能体并行dispatching-parallel-agents
在主分支直接改代码自动创建git worktree隔离using-git-worktrees
写完代码没人审查每任务后派审查子智能体requesting-code-review
收到审查反馈无脑赞同先技术评估再实现receiving-code-review
一次性写大功能拆解为2-5min小任务writing-plans
功能写完不知道怎么收尾验证→4选项→执行→清理finishing-a-dev-branch
Superpowers · AI编程智能体技能框架详解

⚡ Superpowers · AI编程智能体技能框架详解

14个可组合技能 × 7步完整开发工作流 × 11个编程智能体平台
Superpowers 是一套完整的AI编程智能体软件开发方法论,由可组合的技能(Skills)构成,让AI编程助手从”写代码的打字员”进化为”遵循工程纪律的开发者”——先设计再编码、先测试再实现、先验证再交付
🔄 核心工作流:7步从想法到交付
💡 头脑风暴
brainstorming
先理解再动手
🌳 创建工作树
using-git-worktrees
隔离工作空间
📝 编写计划
writing-plans
拆解为2-5min小任务
🚀 子智能体驱动开发
subagent-driven-dev
每任务一个子智能体
🧪 测试驱动开发
test-driven-dev
RED→GREEN→REFACTOR
🔍 请求代码审查
requesting-code-review
每任务审查+终审
✅ 完成分支
finishing-a-dev-branch
验证→合并/PR/丢弃
智能体在每个任务前自动检查是否有技能适用——有1%可能就必须触发,这是强制工作流而非建议
📦 14个技能详解
Testing
🧪 test-driven-development
强制RED-GREEN-REFACTOR循环:先写失败测试→看它失败→写最小代码→看它通过→重构→提交。代码写在测试之前?删掉重来。
铁律:没有失败测试就没有生产代码。写代码前没测试?删除代码,从头来。
何时用:任何新功能/bug修复/重构/行为变更。唯一例外:一次性原型、生成代码、配置文件(需用户确认)
❌ “这次跳过TDD” → 停下,这是合理化借口
❌ 先写代码再补测试 → 删除代码重来
✅ 写测试→看失败→写最小代码→看通过→重构
Debugging
🔍 systematic-debugging
4阶段根因分析流程:①读错误信息 ②稳定复现 ③查最近变更 ④多组件边界插桩。禁止在未完成Phase 1前提出任何修复。
铁律:没有根因调查就没有修复。症状修复=失败。
何时用:任何bug/测试失败/异常行为/性能问题/构建失败。尤其当:时间紧迫(“快速修复”很诱人)、已经试了多次修复、上一个修复没生效
❌ “应该修好了” → 运行验证命令
❌ “只改一行就行” → 先找根因
✅ 读错误→复现→查变更→边界插桩→定位根因→修复→验证
Debugging
✅ verification-before-completion
在声称”完成”之前必须运行验证命令并确认输出。证据先于断言,永远如此。
铁律:没有新鲜验证证据就不能声称完成。本消息没运行验证命令就不能声称通过。
何时用:即将声称工作完成/修复成功/测试通过,提交或创建PR之前
❌ “应该可以了”/”我很有信心” → 信心≠证据
❌ “linter通过了” → linter≠编译器
✅ 运行完整测试→看到0失败→才能说”测试通过”
Collaboration
💡 brainstorming
苏格拉底式设计精炼:逐个提问理解意图→探索2-3种方案→分段展示设计→用户批准→写设计文档→自检→转入实现。硬门:不批准不写代码。
硬门:未展示设计并获得用户批准前,禁止调用任何实现技能、写任何代码、脚手架项目。
何时用:任何创造性工作之前——创建功能、构建组件、添加功能、修改行为。即使”太简单不需要设计”
❌ “太简单了直接写” → 简单项目未审视的假设浪费最多
✅ 理解上下文→逐个提问→2-3方案→分段设计→批准→设计文档→实现
Collaboration
📝 writing-plans
把设计拆解为2-5分钟的bite-sized任务,每个任务含精确文件路径、完整代码、验证步骤。假设执行者是”热情但品味差、无判断力、无项目上下文、讨厌测试的初级工程师”。
原则:DRY + YAGNI + TDD + 频繁提交。每步一个动作。禁止占位符(TBD/TODO/后续补充)。
何时用:有设计文档/需求规格后,写代码之前
❌ “TBD”/”TODO”/”添加适当错误处理” → 计划失败
❌ “类似Task N” → 重复代码(执行者可能乱序读)
✅ 精确路径+完整代码+精确命令+预期输出
Collaboration
🚀 subagent-driven-development
每个任务派发一个全新子智能体实现→两阶段审查(规格合规+代码质量)→下一个任务。子智能体不继承会话上下文——你精确构造它需要的。可连续工作数小时不偏离计划。
核心:新鲜子智能体/任务 + 任务审查(规格+质量) + 最终全分支审查 = 高质量快速迭代
何时用:有实现计划 + 任务基本独立 + 在当前会话中执行
❌ 任务间暂停问”继续吗?” → 用户让你执行计划就执行
✅ 派发子智能体→实现→审查→修复→下一个→最终审查→完成分支
Collaboration
⚡ dispatching-parallel-agents
面对2+个独立问题时,每个问题派发一个专用智能体并行处理。同一响应中多个派发=并行,逐个派发=串行。
核心:每个独立问题域一个智能体,并行运行。3个问题=1个问题的时间。
何时用:3+测试文件失败且根因不同、多个子系统独立故障。不用:故障关联(修一个可能修其他)、需要全局状态、智能体会互相干扰
Collaboration
📋 executing-plans
在独立会话中加载计划→批判性审查→逐任务执行→完成时调用finishing-a-development-branch。无人为中断点。
原则:先批判性审查计划→严格按步骤执行→不跳过验证→阻塞时停下问人
何时用:有实现计划但在独立会话中执行(无子智能体支持时)
Collaboration
🔍 requesting-code-review
派发代码审查子智能体,用精确构造的上下文(非会话历史)评估工作产物。两阶段:规格合规+代码质量。Critical问题阻塞进度。
核心:早审查、勤审查。子智能体驱动开发中每个任务后审查,合并前终审。
何时用:每个任务完成后、主要功能完成后、合并main前
Collaboration
📨 receiving-code-review
收到代码审查反馈时,先技术评估再实现。禁止表演性赞同(“你说得对!”/”好观点!”),要求技术正确性而非社交舒适度。
核心:验证→实现。先问→再假设。技术正确性>社交舒适度。
何时用:收到代码审查反馈时,尤其是反馈看起来不清楚或技术上有疑问时
❌ “你说得对!”/”好观点!” → 表演性赞同,禁止
✅ 重述技术要求→澄清问题→技术反驳(如果错了)→逐项实现+测试
Collaboration
🌳 using-git-worktrees
确保工作在隔离空间进行:先检测是否已在worktree→优先用平台原生工具→回退git worktree。保护当前分支不受变更影响。
核心:先检测已有隔离→用原生工具→回退git。永远不与平台对抗。
何时用:开始需要与当前工作空间隔离的功能开发,或执行实现计划之前
Collaboration
🏁 finishing-a-development-branch
实现完成后:验证测试→检测环境→展示4选项(本地合并/创建PR/保留分支/丢弃)→执行选择→清理worktree。
核心:验证测试→检测环境→展示选项→执行选择→清理
何时用:实现完成、所有测试通过、需要决定如何集成工作时
Meta
✏️ writing-skills
用TDD方法创建新技能:写压力测试场景→看智能体失败(基线)→写技能文档→看智能体遵守→重构堵漏洞。技能=可复用技术指南,不是叙事。
核心:写技能就是TDD应用于流程文档。没看智能体无技能时失败=不知道技能教了正确的事。
何时用:创建新技能、编辑现有技能、验证技能部署前是否有效
Meta
⚡ using-superpowers
入口技能:建立如何发现和使用技能的规则。有1%可能适用就必须触发技能。技能优先级:用户指令>Superpowers技能>系统默认。
铁律:如果技能有1%可能适用,你必须触发它。这不是可选的,不是可协商的。
何时用:任何对话开始时——建立技能发现和触发规则
🎯 解决什么场景问题?
类别场景痛点Superpowers解决核心技能效果
🧭 方向AI拿到需求直接写代码,方向错了白干几小时强制先头脑风暴,理解意图→设计方案→用户批准才动手brainstorming从”写代码的打字员”→”理解需求的设计师”
🧭 方向一次性写大功能,改到后面忘了前面改了什么拆解为2-5min小任务,每任务独立可测可审查writing-plans大功能→bite-sized任务,每步可验证
🧪 质量AI写代码不写测试,或先写代码后补测试(测试只验证已有代码)强制RED-GREEN-REFACTOR,先写失败测试→最小实现→重构test-driven-dev测试真正验证行为,而非验证实现
🧪 质量AI声称”完成了”但测试没跑/没通过声称完成前必须运行验证命令并确认输出verification-before-completion杜绝”应该可以了”的虚假完成声明
🧪 质量AI写完代码没人审查,问题累积到后期才发现每任务后派发审查子智能体,两阶段审查(规格+质量)requesting-code-review问题在发生时被捕获,不累积
🐛 调试AI遇到bug直接猜修复,改了A坏B,反复试错4阶段根因分析:读错误→复现→查变更→边界插桩,禁止未找根因就修systematic-debugging一次修对,而非反复试错
🚀 效率多个独立问题串行处理,浪费时间每个独立问题域派发专用智能体并行处理dispatching-parallel-agents3个问题=1个问题的时间
🚀 效率AI在主分支上直接改代码,搞坏了回不去自动创建git worktree隔离工作空间using-git-worktrees主分支永远干净,实验在隔离空间
🤝 协作收到审查反馈AI无脑赞同(“你说得对!”)然后实现错误建议先技术评估再实现,禁止表演性赞同receiving-code-review技术正确性>社交舒适度
🤝 协作功能写完不知道怎么收尾:合并?PR?还是先放着?验证测试→展示4选项→执行选择→清理worktreefinishing-a-dev-branch结构化完成流程,不遗漏
🏗️ 用Superpowers开发”电商平台订单导出功能”
📋 场景:用户要求”给电商平台加一个订单导出功能,支持CSV和Excel格式,大促期间百万级订单量”
Step 1
💡 头脑风暴 — brainstorming
brainstorming
AI不会直接写代码,而是先问:
① “导出的订单数据范围?全部/按时间/按状态?”
② “百万级是同步导出还是异步生成后下载?”
③ “Excel需要样式(合并单元格/分Sheet)还是纯数据?”
④ “是否需要导出权限控制?”
⑤ “导出失败(超时/数据不完整)怎么通知用户?”

然后提出2-3种方案
方案A:同步导出(简单但大促超时风险高) 方案B:异步生成+通知下载(复杂但可扩展) 方案C:流式分批导出(折中)

用户批准方案B后,写设计文档docs/superpowers/specs/2026-06-23-order-export-design.md,自检(无占位符/无矛盾/无歧义),用户确认后转入实现。

硬门:用户没批准前,一行代码都不写。
Step 2
🌳 创建工作树 — using-git-worktrees
using-git-worktrees
AI检测当前环境GIT_DIR != GIT_COMMON?已在worktree→跳过。否则创建隔离工作空间:
git worktree add .worktrees/feat-order-export feat/order-export

在新分支 feat/order-export 上工作,主分支完全不受影响。如果实验失败,直接丢弃worktree,干干净净。

然后运行项目设置、验证测试基线(确保从干净状态开始)。
Step 3
📝 编写实现计划 — writing-plans
writing-plans
AI把设计拆解为2-5分钟的bite-sized任务,假设执行者是”热情但品味差、无上下文、讨厌测试的初级工程师”:

Task 1:导出任务模型 + 数据库迁移(写失败测试→看失败→写迁移→看通过→提交)
Task 2:导出任务创建API(写失败测试→看失败→写API→看通过→提交)
Task 3:CSV格式生成器(写失败测试→看失败→写生成器→看通过→提交)
Task 4:Excel格式生成器(写失败测试→看失败→写生成器→看通过→提交)
Task 5:异步任务调度+进度通知(写失败测试→看失败→写调度→看通过→提交)
Task 6:百万级分批流式导出(写失败测试→看失败→写流式→看通过→提交)
Task 7:导出权限+下载API(写失败测试→看失败→写权限→看通过→提交)
Task 8:集成测试+错误处理(写失败测试→看失败→写集成→看通过→提交)

每个Task含精确文件路径+完整代码+验证命令+预期输出,零占位符。
保存到 docs/superpowers/plans/2026-06-23-order-export.md
Step 4
🚀 子智能体驱动开发 — subagent-driven-development
subagent-driven-dev
每个Task派发一个全新子智能体,子智能体不继承主会话上下文——你精确构造它需要的:

Task 1:派发子智能体A → 实现导出任务模型+迁移 → 两阶段审查(规格合规+代码质量)
Task 2:派发子智能体B → 实现创建API → 审查 → Critical问题派修复子智能体 → 再审查
Task 3:派发子智能体C → 实现CSV生成器 → 审查
…连续执行所有8个任务,不暂停问”继续吗?”

关键:子智能体在实现时自动遵循TDD(下一个技能),所以每个Task内部是:
写失败测试 → 看失败 → 写最小代码 → 看通过 → 提交

全部任务完成后,派发最终代码审查子智能体做全分支审查。
Step 5
🧪 测试驱动开发 — test-driven-development
test-driven-dev
每个子智能体在实现Task时强制RED-GREEN-REFACTOR

RED:写失败测试
test('export task creates with pending status', async () => {
  const task = await createExportTask({format:'csv', dateRange:'2026-06'});
  expect(task.status).toBe('pending');
});

运行 → FAIL(“createExportTask is not defined”) ✅ 正确的失败

GREEN:写最小代码让测试通过
async function createExportTask(opts) {
  return { id: uuid(), status: 'pending', ...opts };
}

运行 → PASS

REFACTOR:清理(提取常量、改善命名)→运行→仍PASS→提交

如果子智能体先写了代码再补测试?删除代码,从头来。
Step 6
🔍 请求代码审查 — requesting-code-review
requesting-code-review
每Task完成后派发审查子智能体,审查者拿到精确上下文(非会话历史):

Task 3完成后:
BASE_SHA=a7981ec HEAD_SHA=3df7661
派发审查子智能体:”审查CSV生成器实现,规格见Task 3…”

审查结果:
✅ Strengths:流式写入、内存可控
⚠️ Important:缺少BOM头(Excel打开中文乱码)
⚡ Minor:magic number 8192(buffer size)

Important问题阻塞进度,派修复子智能体加BOM头 → 再审查 → 通过 → 继续
Step 7
🏁 完成分支 — finishing-a-development-branch
finishing-a-dev-branch
Step 1:验证测试 → npm test → 42/42 PASS ✅
Step 2:检测环境 → 在worktree中,命名分支 feat/order-export
Step 3:确定基分支 → main
Step 4:展示选项:
  1️⃣ 本地合并回 main
  2️⃣ 推送并创建Pull Request
  3️⃣ 保留分支(稍后处理)
  4️⃣ 丢弃此工作

用户选择 2️⃣ → 创建PR → 清理worktree → 完成!
补充
🐛 遇到bug时 — systematic-debugging + dispatching-parallel-agents
systematic-debugging dispatching-parallel-agents
开发过程中发现3个测试文件同时失败:
csv-export.test.ts:2个失败(编码问题)
excel-export.test.ts:1个失败(大数精度丢失)
task-scheduler.test.ts:3个失败(竞态条件)

systematic-debugging:每个问题先4阶段根因分析——读错误→复现→查变更→边界插桩,禁止未找根因就修

dispatching-parallel-agents:3个问题独立→派发3个子智能体并行调查:
子智能体A修csv编码 → 子智能体B修excel精度 → 子智能体C修竞态条件
3个问题=1个问题的时间,而非串行3倍时间
🧠 核心哲学
🧪
测试驱动开发
先写测试,永远如此。没看测试失败=不知道测试了正确的事。
📊
系统化优于临时
流程优于猜测。根因分析优于症状修复。计划优于即兴。
🎯
复杂度削减
简洁是首要目标。YAGNI(你不会需要它)。DRY(不要重复)。
🔬
证据优于声称
验证后才能声明成功。”应该可以了”=说谎,不是验证。
🌐 支持11个AI编程平台
Claude Code Antigravity Codex App Codex CLI Cursor Factory Droid Gemini CLI GitHub Copilot CLI Kimi Code OpenCode Pi
一句话总结:Superpowers 让AI编程智能体从“拿到需求就写代码”进化为“先理解再设计→先计划再实现→先测试再编码→先验证再交付”的工程纪律执行者。14个技能自动触发(有1%可能适用就必须触发),不是建议而是强制工作流。结果是:方向对、质量高、bug少、可验证、可审查、可交付。

技能链接

https://github.com/jnMetaCode/superpowers-zh