這篇文章詳細紀錄了 Anthropic 如何使用並行代理團隊來構建一個功能完備的 C 編譯器。以下是該部落格文章的全文完整繁體中文翻譯: 使用並行 Claude 代理團隊構建 C 編譯器 發佈日期:2026 年 2 月 5 日 作者:Nicholas Carlini(Anthropic 安全團隊研究員) 我們指派了 Opus 4.6 模型,利用「代理團隊(agent teams)」構建了一個 C 編譯器,然後(基本上)就放手不管了。以下是這次實驗告訴我們關於自主軟體開發未來的啟示。 對代理團隊進行極限壓力測試 我一直在實驗一種監管語言模型的新方法,我們稱之為「代理團隊」。在代理團隊中,多個 Claude 實例在一個共享的代碼庫上並行工作,無需人類主動干預。這種方法極大擴展了 LLM 代理能達到的目標範圍。 為了進行壓力測試,我指派了 16 個代理,要求它們從零開始用 Rust 撰寫一個能編譯 Linux 核心(Kernel)的 C 編譯器。經過將近 2,000 次 Claude Code 會話和約 2 萬美元的 API 成本,這個代理團隊產出了一個擁有 10 萬行代碼的編譯器,能夠在 x86、ARM 和 RISC-V 上構建 Linux 6.9。 編譯器本身是一個有趣的成品,但我這裡的重點在於我從中學到的經驗:如何為長期運行的自主代理團隊設計「腳手架(harnesses)」、如何編寫測試以確保代理在無人監管的情況下不偏離軌道、如何結構化工作以便多個代理能並行推進,以及這種方法的極限在哪裡。 實現長期運行的 Claude 現有的代理架構(如 Claude Code)通常需要一個操作者在線協作。如果你要求解決一個長期且複雜的問題,模型可能會解決一部分,但最終會停止並等待輸入——例如提問、狀態更新或澄清請求。 為了實現持續的自主進展,我構建了一個將 Claude 置於簡單循環中的腳手架(如果你看過 Ralph-loop,這應該很眼熟)。當它完成一個任務,它會立即開始下一個。(請在容器中運行,不要在你的實際機器上運行)。 #!/bin/bash while true; do COMMIT=$(git rev-parse --short=6 HEAD) LOGFILE="agent_logs/agent_...
這一套以 SOUL.md、HEARTBEAT.md 為核心的檔案架構並不是偶然。 在前一篇文章中提到 OpenClaw prompt 和 md 的解析, 而是採用了許多前人的累積與邏輯上把 AI 的「意識」與「記憶」封裝成人類可讀的 Markdown 檔案,初看覺得這種 Unix 哲學的 「Everything is a file」 很優雅,但實際思考這套系統要跑在生產環境時,體感上出現了一些有趣的摩擦點。 核心是把複雜的向量資料庫(Vector DB)還原成最原始的文字檔。 ■ 狀態同步的 Technical Debt: 當 Agent 運作頻率變高,頻繁讀寫 Markdown 造成的 IO 競爭與檔案鎖定,在多 Agent 協作時可能變成系統瓶頸。 ■ 記憶碎片的清理機制: 雖然借鏡了史丹佛的記憶流理論,但現實中長期精華(MEMORY.md)的摘要演算法如果沒寫好,檔案體積膨脹後的 Context Window 成本與遺忘曲線會變得很難調校。 ■ 「心跳」的邊際成本: 透過 Cron Job 定時讀取 HEARTBEAT.md 讓 Agent 自發行動,這在 0 到 1 的 Side Project 很浪漫,但到了需要規模化的擴張期,這種「主動式」消耗的 Token 成本與實質產出比,目前還看不太出回報率。 同時有朋友提到的 https://soul.md/ 網站,確實很容易讓人誤以為這是一個獨立於 OpenClaw 之外的原始出處。 經過仔細查證,這其實是一個 **「概念致敬」與「工程實作」的結合體** 。簡單來說:概念來自 Anthropic 的內部洩漏,但你看到的這套 Markdown 檔案架構(SOUL.md 等),確實是 OpenClaw (Peter Steinberger) 的原創發明。 這裡幫你釐清這三者錯綜複雜的關係: https://soul.md/ 這個網站就是 OpenClaw 的作者 Peter Steinberger 建立的。 如果你看該網頁的最底部,署名是: Written by Clawd 🦞 ... The original soul document Clawd's instructions @steipete 所以這個網站並不是 OpenClaw 的「前身」或「參考來源」,而是作者為了闡述 OpenClaw 「為...