2026年3月17日3 分鐘閱讀agent-skills

Superpowers:89K 星 Skills 框架如何重新定義開發者使用 AI Agent 的方式

深入剖析 obra/superpowers:擁有 89K+ GitHub 星數的 agentic skills 框架,在 Claude Code、Codex CLI、Cursor 和 Gemini CLI 上強制執行 TDD、結構化規劃與子代理驅動開發。

DH
Danny Huang

你大概只用了 AI Agent 的 30%

多數開發者裝 Claude Code 之後打 prompt、拿回程式碼。程式碼通常不錯,有時優秀。但總覺得哪裡不對。Agent 在測試之前先寫實作。架構靠猜不是靠問。修 bug 處理表面症狀不追根因。動作很快 -- 像跳過無聊步驟的熱心實習生。

不是 agent 的錯。大型語言模型被訓練成「有幫助的」,實務上就是急著產出。你要一個功能,agent 馬上寫程式。不會停下來問你真正需要什麼。不寫規格。不規劃檔案結構。更不會先寫失敗測試。

Jesse Vincent 注意到這個模式,決定修正。不是建新模型或新工具,而是給現有 agent 一套規則。成果:Superpowers,可組合 skill 構成的框架,把 AI coding agent 從打字快的人變成有紀律的工程夥伴。截至 2026 年 3 月,超過 89,000 GitHub star。史上成長最快的開發者工具之一。

概念簡單到令人意外:agent 很聰明但缺紀律,那就給它紀律。

誰做的、為什麼

Jesse Vincent 不是第一次打造開發者依賴的工具。1990 年代創造 Request Tracker (RT)。2005-2008 管 Perl 6。共同創辦 Keyboardio。為 Android 打造 K-9 Mail,後被 Mozilla 收購改名 Thunderbird for Android。共同主線:Jesse 打造其他人賴以運作的基礎設施,對 workflow 極度講究。

Superpowers 源自 Jesse 用 Claude Code 做正式開發的經驗。Agent 有能力但不穩定。放著不管會跳過測試、在理解需求前就實作、對沒診斷的 bug 套速成修補。這不是 AI 問題,是工程紀律問題。資淺開發者也會做一樣的事。

關鍵洞察:AI agent 會回應結構。你沒辦法用訓話要求它遵守最佳實踐。但你可以給它明確的步驟式 workflow 和硬性關卡,條件滿足前阻擋進度。說「先寫測試」的 skill 會被忽略。說「沒有失敗測試就不准寫產品程式碼。先寫了?刪掉。從頭來過。」的 skill 會被遵守。

哲學核心:把 AI agent 當有能力但缺紀律的資淺工程師。給它能把資淺變資深的流程護欄。

核心 Skill

Superpowers 附帶十幾個 skill,組成完整開發 workflow。每個是 SKILL.md,包含明確指令、硬性關卡和流程。

Brainstorming:先探索再動手

任何創意工作前啟動。硬性關卡:

在展示設計並獲使用者核准前,不准呼叫任何實作 skill、寫任何程式碼、建任何骨架,或採取任何實作行動。

強制 agent 先探索專案脈絡(讀檔案、文件、最近 commit),一次問一個釐清問題,提 2-3 個方案及取捨,分段展示設計供核准,寫規格文件。核准後才轉入實作。

為什麼重要:軟體開發中最浪費的工作來自建造錯的東西。Agent 快速建造錯的東西,損失比先問兩個問題更多。

Superpowers 5(2026 年 3 月初)加入視覺 brainstorming -- 瀏覽器內 HTML mockup 取代 ASCII 圖表。設計涉及視覺元素時 agent 先提供「視覺夥伴」。

撰寫計畫:先規格再寫碼

設計核准後拆成一口大小的任務。每個 2-5 分鐘工作量,精確檔案路徑,完整程式碼脈絡,驗證步驟。假設執行者「對 codebase 零脈絡,品味可疑」。

嚴苛但實際。Subagent 執行任務時每個都從乾淨脈絡開始。計畫必須詳細到零知識的新 agent 也能正確完成每一步。

計畫強制 DRY、YAGNI、TDD。每個任務包含測什麼、怎麼測、預期輸出。

測試驅動開發:先測試再實作

框架中最嚴格的 skill。「鐵律」:

沒有失敗測試就不准寫產品程式碼。先寫了?刪掉。從頭來過。沒有例外。

經典紅-綠-重構:失敗測試、確認因正確原因失敗、最少程式碼讓它過、確認全部通過、重構。附反模式參考列出常見 TDD 錯誤。

引發最強反應的 skill。有人愛 -- 終於讓 agent 寫測試。有人抗拒 -- 自己也不做 TDD。但成果不說謊。chardet 用 Superpowers 發布 7.0.0:效能 41 倍、準確率 96.8%、修復數十個長期問題。涵蓋 2,161 檔案 99 種編碼的全面測試套件,是 TDD skill 的直接產物。

系統化除錯:先診斷再修復

四階段:根因調查、假設形成、目標修復、驗證。鐵律:

沒有根因調查就不准修復。

明確警告最想跳過的情境:「尤其在時間壓力下使用。緊急狀況讓人想猜。」包含根因追蹤、縱深防禦、條件式等待。

解決最常見 AI 失敗模式。沒引導的 agent 遇 bug 試隨機修復。第一個讓錯誤消失就宣告勝利。除錯 skill 強制理解後才碰程式碼。

Code Review:先驗證再合併

派獨立 subagent review 完成的工作。Reviewer 只收精心打造的評估脈絡,不收實作者對話歷史。防止因知道實作者思路產生偏見。

對照計畫檢查,按嚴重度回報,critical 問題阻擋進度。Receiving-code-review skill 處理另一面:回應 feedback 不防衛、不做無關修改。

Subagent 驅動開發:平行化獨立任務

Superpowers 從「好實踐」進化到「架構創新」的地方。從計畫為每個任務派全新 agent,完成後兩階段 review:先檢查規格、再檢查品質。

每個 subagent 從乾淨脈絡開始。只收特定任務描述和相關脈絡,不是完整對話歷史。防止脈絡汙染(累積脈絡降低判斷),讓協調 agent 管理許多任務而不耗盡 context window。

結果:Claude 連續自主工作幾小時不偏離計畫很常見。協調 agent 派遣、review、處理失敗、繼續推進 -- 只在真正需要判斷時才向人回報。

哲學:該嚴格的嚴格、該彈性的彈性

Skill 不是全都同一種方式運作。有些嚴格帶硬性關卡。有些彈性提供引導不強制。刻意的。

TDD 和除錯嚴格。鐵律、明確禁令、刪除重來的後果。偷工減料會造成複利傷害的領域。今天跳過的測試明天變花好幾小時除錯的 regression。沒調查的根因下游再生三個 bug。

Brainstorming 有結構但有彈性。Checklist 和硬性關卡(設計核准前不寫碼),但問的問題和提的方案根據脈絡調整。Todo app 簡短設計。分散式系統詳盡設計。

Code review 是建議性的。回報發現和嚴重度,人類決定修哪些。

這就是「解釋為什麼,而不是什麼」。每個 skill 解釋理由:為什麼測試必須先失敗再通過、為什麼根因比症狀重要、為什麼 subagent 用乾淨脈絡防偏移。Agent 遵守因為理解原則,不是被盲目要求。

安裝與使用

Claude Code(官方 Marketplace)

自 2026 年 1 月:

/plugin install superpowers@claude-plugins-official

或社群 marketplace:

/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

Cursor

/add-plugin superpowers

或搜「superpowers」。

Codex CLI

告訴 Codex:

Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.codex/INSTALL.md

Gemini CLI

gemini extensions install https://github.com/obra/superpowers

Skill 如何觸發

安裝後自動觸發。開新 session 要求建功能。Agent 偵測任務類型啟動 brainstorming。核准設計 -- writing-plans。開始實作 -- TDD。遇 bug -- systematic-debugging。

手動也行:「用 brainstorming skill 幫我想一下這個。」但自動觸發才是重點。不需記用哪個 skill,框架負責調度。

驗證安裝

新 session。要求應觸發 skill 的事 -- 「幫我規劃這功能」或「來除錯這問題」。安裝正確的話 agent 宣告用哪個 skill,遵循結構化流程而非直接寫碼。

跨 Agent 相容性

Superpowers 最重要的設計決策:平台無關。在 Claude Code、Cursor、Codex CLI、OpenCode、Gemini CLI、Qwen Code、Goose CLI、Auggie 上都能用。因為 skill 是 Markdown,不是平台專屬 plugin。任何能讀 SKILL.md 的 agent 都能遵循指令。

讓 Superpowers 成為可攜帶的方法論。團隊用 Claude Code 同事偏好 Codex CLI -- 兩個跑同一組 skill。Brainstorming、TDD、subagent 協調全都轉移。跨 agent skill 生態系正匯聚到這模式:知識編碼一次,到處適用。

Claude Code 整合最深。allowed-tools 沙箱、自動 plugin 更新、原生 subagent 支援意味某些 skill(特別是 subagent 驅動開發)在 Claude Code 最好。其他 agent 得到核心 workflow 但沒進階調度。

在 Superpowers 上寫自己的 Skill

Superpowers 是地基不是天花板。內建 writing-skills skill 教 agent 遵循最佳實踐建新 skill。Meta 沒錯 -- 但代表你可以用領域特定 skill 擴展框架。

常見擴展:

  • Deploy skill 強制執行發布 checklist
  • ADR skill 記錄設計選擇
  • 安全 review skill 檢查合規要求
  • 到職 skill 把部落知識編碼給新成員

自訂 skill 能跟既有 skill 組合。Deploy skill 可依賴 code review 先完成。ADR skill 可接入 brainstorming workflow。

撰寫有效 skill 的詳細指南看如何寫第一個 SKILL.md。區分好 skill 和 490K+ 雜訊的設計原則看什麼是好的 Skill 設計

Try Termdock Drag Resize Terminals works out of the box. Free download →

跟寫好 Prompt 有什麼不同

把詳細 prompt 寫進去不就好了?CLAUDE.md 放 TDD 指令、system prompt 加「永遠先問釐清問題」、跳過框架?

你可以試。效果不一樣。

單一 prompt 指令是建議。Agent 方便時遵守,壓力大時忽略。CLAUDE.md 寫「永遠先寫測試」,前三個任務會先寫。第四個 context 變長問題變複雜,悄悄跳過。你不會發現,直到某東西壞掉。

Superpowers skill 是帶執行機制的流程。TDD skill 不是建議先寫測試。用鐵律強制,包含刪除在測試前寫的程式碼的指令,圍繞紅-綠-重構架構每一步。速限標誌和減速丘的差別。一個告知,另一個物理阻止。

複利效果重要。單個 skill 有用。TDD 提升品質。Brainstorming 減少浪費。框架合在一起改變工作方式。Brainstorming 產出規格。規格餵入計畫。計畫餵入 subagent 開發。Subagent 遵循 TDD。Code review 抓 TDD 漏掉的。每個 skill 的輸出是下一個的輸入。

想像下棋。知道個別棋子怎麼走是初學者。理解開局、中盤、殘局是棋手。Superpowers 不是一堆棋步,是棋步如何配合的戰略。

開始使用:5 步驟

從「有興趣」到「有效使用」的最短路徑:

  1. 安裝到偏好的 agent。Claude Code:/plugin install superpowers@claude-plugins-official

  2. 從真實任務開始。 不是玩具範例。你真正需要建的功能或修的 bug。框架在真實工作上發光。

  3. 跟著 brainstorming。 Agent 開始問問題而非寫碼時忍住「直接做」的衝動。回答問題。核准設計。看實作變多清晰。

  4. 讓 TDD 跑。 第一次看 agent 寫失敗測試、看它失敗、寫最少碼讓它過 -- 你會感受到差異。從這循環產出的程式碼更小更聚焦。

  5. Review 並擴展。 用 Superpowers 完成第一個專案後,你知道哪些部分適合、哪些需調整。不適合的寫自訂 skill。Skill 開發 workflow 涵蓋完整過程。

Superpowers 不是魔法棒。不會把爛計畫變好或讓錯架構運作。它確保簡單的錯誤不發生:因趕時間、跳步驟、沒問問題而犯的。對多數專案,這些簡單錯誤反而花最多時間。

MIT 授權開源。積極維護。五個月零到 89,000 star。這軌跡不會發生,除非工具真為很多人解決了真實問題。

如果你用 AI coding agent 而且曾想「要是它能慢下來好好做事就好了」-- Superpowers 正是這件事。給 AI agent 紀律。結果證明,這就是它們需要的全部。

DH
Free Download

Ready to streamline your terminal workflow?

Multi-terminal drag-and-drop layout, workspace Git sync, built-in AI integration, AST code analysis — all in one app.

Download Termdock →
#agent-skills#superpowers#claude-code#tdd#subagent#ai-agents#developer-tools

相關文章