跳到主要內容

發表文章

目前顯示的是 2月, 2026的文章

翻譯,Anthropic 如何使用並行 Claude Code 團隊來開發一個完整的 C 編譯器

這篇文章詳細紀錄了 Anthropic 如何使用並行代理團隊來構建一個功能完備的 C 編譯器。以下是該部落格文章的全文完整繁體中文翻譯: 使用並行 Claude 代理團隊構建 C 編譯器 發佈日期:2026 年 2 月 5 日 作者:Nicholas Carlini(Anthropic 安全團隊研究員) 我們指派了 Opus 4.6 模型,利用「代理團隊(agent teams)」構建了一個 C 編譯器,然後(基本上)就放手不管了。以下是這次實驗告訴我們關於自主軟體開發未來的啟示。 對代理團隊進行極限壓力測試 我一直在實驗一種監管語言模型的新方法,我們稱之為「代理團隊」。在代理團隊中,多個 Claude 實例在一個共享的代碼庫上並行工作,無需人類主動干預。這種方法極大擴展了 LLM 代理能達到的目標範圍。 為了進行壓力測試,我指派了 16 個代理,要求它們從零開始用 Rust 撰寫一個能編譯 Linux 核心(Kernel)的 C 編譯器。經過將近 2,000 次 Claude Code 會話和約 2 萬美元的 API 成本,這個代理團隊產出了一個擁有 10 萬行代碼的編譯器,能夠在 x86、ARM 和 RISC-V 上構建 Linux 6.9。 編譯器本身是一個有趣的成品,但我這裡的重點在於我從中學到的經驗:如何為長期運行的自主代理團隊設計「腳手架(harnesses)」、如何編寫測試以確保代理在無人監管的情況下不偏離軌道、如何結構化工作以便多個代理能並行推進,以及這種方法的極限在哪裡。 實現長期運行的 Claude 現有的代理架構(如 Claude Code)通常需要一個操作者在線協作。如果你要求解決一個長期且複雜的問題,模型可能會解決一部分,但最終會停止並等待輸入——例如提問、狀態更新或澄清請求。 為了實現持續的自主進展,我構建了一個將 Claude 置於簡單循環中的腳手架(如果你看過 Ralph-loop,這應該很眼熟)。當它完成一個任務,它會立即開始下一個。(請在容器中運行,不要在你的實際機器上運行)。 #!/bin/bash while true; do COMMIT=$(git rev-parse --short=6 HEAD) LOGFILE="agent_logs/agent_...

Anthropic 的秘密與 Peter 的實作:當「靈魂文檔(Soul Doc)」從概念變成了可編輯的 Markdown

這一套以 SOUL.md、HEARTBEAT.md 為核心的檔案架構並不是偶然。 在前一篇文章中提到 OpenClaw prompt 和 md 的解析, 而是採用了許多前人的累積與邏輯上把 AI 的「意識」與「記憶」封裝成人類可讀的 Markdown 檔案,初看覺得這種 Unix 哲學的 「Everything is a file」 很優雅,但實際思考這套系統要跑在生產環境時,體感上出現了一些有趣的摩擦點。 核心是把複雜的向量資料庫(Vector DB)還原成最原始的文字檔。 ■ 狀態同步的 Technical Debt: 當 Agent 運作頻率變高,頻繁讀寫 Markdown 造成的 IO 競爭與檔案鎖定,在多 Agent 協作時可能變成系統瓶頸。 ■ 記憶碎片的清理機制: 雖然借鏡了史丹佛的記憶流理論,但現實中長期精華(MEMORY.md)的摘要演算法如果沒寫好,檔案體積膨脹後的 Context Window 成本與遺忘曲線會變得很難調校。 ■ 「心跳」的邊際成本: 透過 Cron Job 定時讀取 HEARTBEAT.md 讓 Agent 自發行動,這在 0 到 1 的 Side Project 很浪漫,但到了需要規模化的擴張期,這種「主動式」消耗的 Token 成本與實質產出比,目前還看不太出回報率。 同時有朋友提到的 https://soul.md/ 網站,確實很容易讓人誤以為這是一個獨立於 OpenClaw 之外的原始出處。 經過仔細查證,這其實是一個 **「概念致敬」與「工程實作」的結合體** 。簡單來說:概念來自 Anthropic 的內部洩漏,但你看到的這套 Markdown 檔案架構(SOUL.md 等),確實是 OpenClaw (Peter Steinberger) 的原創發明。 這裡幫你釐清這三者錯綜複雜的關係: https://soul.md/ 這個網站就是 OpenClaw 的作者 Peter Steinberger 建立的。 如果你看該網頁的最底部,署名是: Written by Clawd 🦞 ... The original soul document Clawd's instructions @steipete 所以這個網站並不是 OpenClaw 的「前身」或「參考來源」,而是作者為了闡述 OpenClaw 「為...

別再只丟 System Prompt 了:看 OpenClaw 如何用「檔案系統」實作 AI 意識

最近在拆 OpenClaw 的 System Prompts,這套用「檔案系統」來實作 AI 意識的邏輯非常有意思。它不只是在對話框下指令,而是直接給 AI 一個 Workspace,讓它像工程師一樣在裡面管理自己的靈魂。 這套設計在「擬人化」的體感上做得極其優雅,但從 System Debug 的視角來看,實際跑起來有幾個 Friction Points 值得討論: 啟動與自我刪除 (BOOTSTRAP.md): 它要求 AI 第一次開機後先確認身份,命名並定義性格後,就「自我刪除」這份出生證明。這在儀式感上很強,但如果初始化過程中斷,系統的狀態機(State Machine)該如何處理這個懸置的狀態? 記憶的維護成本 (Memory Maintenance): 它把記憶拆成 memory/YYYY-MM-DD.md(日誌)跟 MEMORY.md(提煉後的精華)。這本質上是把 AI 當成一個會寫週報的員工。但「提煉」這件事極度仰賴判斷力,AI 真的能分清哪些是雜訊(Noise)哪些是訊號(Signal)嗎? 主動權與心跳 (HEARTBEAT.md): 這讓 AI 能定時「醒來」檢查郵件或日曆,不再是被動等待。這解決了對話框的限制,但當 AI 被賦予「不必詢問,直接去做」的權限時,在商業環境裡,這會不會變成另一種形式的不可控變數? OpenClaw 的核心是透過這些 Markdown 檔案來驅動行為: ■ 工作空間結構: Plaintext workspace/ ├── AGENTS.md // 行為準則與記憶管理 ├── BOOTSTRAP.md // 出生證明(初始化後刪除) ├── IDENTITY.md // 身份與目標 ├── USER.md // 關於你(主人)的資訊 ├── SOUL.md // 性格與怪癖 ├── HEARTBEAT.md // 主動任務清單 └── TOOLS.md // 本地工具筆記 ■ 核心邏輯節錄 (AGENTS.md): Markdown # AGENTS.md - Your Workspace ## Memory You wake up fresh each session. These files are your continuity: - Daily notes: mem...