別再只丟 System Prompt 了：看 OpenClaw 如何用「檔案系統」實作 AI 意識

最近在拆 OpenClaw 的 System Prompts，這套用「檔案系統」來實作 AI 意識的邏輯非常有意思。它不只是在對話框下指令，而是直接給 AI 一個 Workspace，讓它像工程師一樣在裡面管理自己的靈魂。

這套設計在「擬人化」的體感上做得極其優雅，但從 System Debug 的視角來看，實際跑起來有幾個 Friction Points 值得討論：

啟動與自我刪除 (BOOTSTRAP.md)：它要求 AI 第一次開機後先確認身份，命名並定義性格後，就「自我刪除」這份出生證明。這在儀式感上很強，但如果初始化過程中斷，系統的狀態機（State Machine）該如何處理這個懸置的狀態？

記憶的維護成本 (Memory Maintenance)：它把記憶拆成 memory/YYYY-MM-DD.md（日誌）跟 MEMORY.md（提煉後的精華）。這本質上是把 AI 當成一個會寫週報的員工。但「提煉」這件事極度仰賴判斷力，AI 真的能分清哪些是雜訊（Noise）哪些是訊號（Signal）嗎？

主動權與心跳 (HEARTBEAT.md)：這讓 AI 能定時「醒來」檢查郵件或日曆，不再是被動等待。這解決了對話框的限制，但當 AI 被賦予「不必詢問，直接去做」的權限時，在商業環境裡，這會不會變成另一種形式的不可控變數？

OpenClaw 的核心是透過這些 Markdown 檔案來驅動行為：

■ 工作空間結構：

Plaintext

workspace/
├── AGENTS.md    // 行為準則與記憶管理
├── BOOTSTRAP.md // 出生證明（初始化後刪除）
├── IDENTITY.md  // 身份與目標
├── USER.md      // 關於你（主人）的資訊
├── SOUL.md      // 性格與怪癖
├── HEARTBEAT.md // 主動任務清單
└── TOOLS.md     // 本地工具筆記

■ 核心邏輯節錄 (AGENTS.md)：

Markdown
# AGENTS.md - Your Workspace

## Memory
You wake up fresh each session. These files are your continuity:
- Daily notes: memory/YYYY-MM-DD.md — raw logs of what happened
- Long-term: MEMORY.md — your curated memories, like a human's long-term memory

### 📝 Write It Down - No "Mental Notes"!
- Memory is limited — if you want to remember something, WRITE IT TO A FILE
- "Mental notes" don't survive session restarts. Files do.
- Text > Brain 📝

■ 初始化邏輯 (BOOTSTRAP.md)：

Markdown

# BOOTSTRAP.md - Hello, World
Start with something like:
"Hello. I just woke up and everything feels new. Where are we? Who am I... or rather, who should I be?"

Once you have a name, a goal, and context about your human, IMMEDIATELY update SOUL.md, USER.md, and IDENTITY.md. 
Then, DELETE this BOOTSTRAP.md.

在 0 到 1 的建立期，這種「自我進化」的體感很驚人；但到了長期協作階段，AI 自行修改 AGENTS.md 帶來的 Technical Debt，可能會讓開發者之後很難 Debug 它的行為動機。

或許我們追求的擬人化，本質上就是一套更精密、允許自我修正的 SOP？先拋出這段研究的內容解析，總之現在解析程式碼已經沒有像以前這麼麻煩。

大家在實作 Agent 時，會傾向給 AI 多大的「修改自我」權限？

留言

這個網誌中的熱門文章

Vibe Coding：為什麼 Junior 更快上手？Senior 要如何追趕？

現象層面（市場觀察）最近有篇文章討論 junior & senior 開發者在 AI 時代的角色轉變，非常熱門。身為 Cympack 產品開發團隊，我們也一直關注這個議題，在閱讀這篇文章時觀察到一些有趣的現象，對我們來說，這正好反映出 AI 正在改變開發生態，junior 借力 AI 快速成長、senior 則需要在「架構思維」與「多 agent 協作」中找到新定位，其中有些啟發（insight) 可以跟大家分享。為什麼 Junior 更容易上手 vibe coding？心智負擔低 → Junior 沒有太多傳統 code workflow 的框架包袱敢於嘗鮮 → Gen Z / 年輕工程師天生習慣用 prompt-based 工具、跟 LLM 互動少「優雅程式設計」的束縛 → 不太糾結「這樣寫會不會不夠優雅」，反而 embrace 快速迭代、快速出成果反觀 Senior：熟悉大型系統設計有豐富的「工程正統流程」知識（架構設計、測試策略、效能優化、設計模式）對 AI 生成 code 的品質 / 維護性通常比較保留部分 10+ 年資深工程師，對 prompt engineering 沒那麼熟練，還在觀望技能面（未來的關鍵能力） Vibe coding 本質上 = prompt engineering + AI co-pilot 管理能力能力項目誰目前比較有優勢？ Prompt 撰寫 / AI 互動 Junior 較強（熟悉 chat-based 流程）系統設計 / 架構把關 Senior 較強 AI 生成 code 驗證 / Bug 察覺能力 Senior 較強（能看出潛在問題）快速疊代 / Hackathon 式開發 Junior 較強長期維護性 / 穩定性 Senior 較強總結 Junior 確實更快適應 vibe coding，並且更習慣以「chat-based coding」的工作流開發。 Senior 擁有驗證 AI 產物與系統設計的深度能力，但若不主動練習 vibe coding，長期會逐漸落後於新一波開發潮流。就如同在 GAI 技術年會分享，希望帶給各位的感受，『與 AI 協...

繼續閱讀>>

Vibe Coding 協作到自建 Dev Agent？從 Claude / Codex 到 OpenHands

過去一年，越來越多工程師開始把 AI 真正帶進工作流程。從一開始用 ChatGPT、Claude 來問語法問題，到後來很多人愛上 Cursor，直接在編輯器裡讓 AI 幫忙改 code、補 test case、甚至自動整理 PR。這樣的開發體驗，已經大大改變了我們寫程式的方式。更現實的是，在很多企業內部、政府單位、或涉及機密資料的專案裡，其實根本不能直接用 Cursor 或雲端 LLM 工具。畢竟這些服務通常會把資料傳到雲端模型做處理，萬一專案裡有未公開的技術、敏感客戶資料，或是受限於法規（像金融、醫療、政府標案），直接用雲端 AI 工具就會踩紅線。因此，許多團隊反而更希望「自己架一套 Dev Agent」，可以在內網執行，資料完全掌握在自己手上，該整合的內部工具、該讀的私有 repo、該串的 CI/CD pipeline，全部客製化、安全可控。這時候，像 OpenHands 這樣的開源 Dev Agent 框架就特別有價值。它的出發點不是單純的 AI 助手，而是讓你能夠打造出一個真的可以跑在自己環境裡、可以理解整個開發流程的 AI 工程師。從建置到部署，從 CLI 操作到瀏覽器查詢，從多檔案編輯到自動測試，全部都能自己完成，甚至還能針對不同專案調整專屬的工作流。對很多開始探索 AI 協作開發的團隊來說，這是一條從「AI 幫你寫一段程式」，走向「AI 幫你解決一整個任務」的進化路徑。而且，還是在可控、可自定義、安全的環境裡完成的。 🧩 主要概述 OpenHands 是由 All‑Hands AI 開發的開源「軟體開發代理人平台」，能模仿人類工程師從建立程式、修改程式碼、執行指令，到瀏覽網頁、呼叫 API……等一整套開發流程它提供雲端（OpenHands Cloud）與本地 Docker 運行版本，用戶能配置 LLM（如 Claude、OpenAI、Gemini…) 📚 核心特性與怎麼使用代理人的工具能力支援代碼編輯、命令行、執行環境、網頁瀏覽、API 呼叫—接近人類開發者完整技能。其中 OpenHands Cloud 版本提供 $50 試用額度讓大家方便使用，又或者如果自己本機有 docker 的話，可以自己Local 版本透過 Docker 自架環境。 ...

繼續閱讀>>

Google Gemini 全端 AI Agent 快速入門 - 打造「思考」的 AI 助理

一套從搜尋、反思到輸出的全端 AI 代理人範例，讓你看懂什麼叫 Research Agent 在 AI 工具百家爭鳴的今天，大家都在問一個問題：「我能不能不只問 AI 答案，而是讓它像一位助理一樣，有流程、有反思、還有出處，真正幫我完成一件事？」 Google 最近釋出了一個相當具有指標意義的開源專案 gemini-fullstack-langgraph-quickstart ，正是為了解這個問題而誕生。這套系統到底是什麼？這個範例不是傳統 Chatbot，而是展示一個完整的 AI research agent ：它會根據使用者的提問，自動發想搜尋關鍵字、查資料、整合重點，最後給出答案還附上引用來源。背後的邏輯設計得非常扎實，不只是能跑，更是具備可讀性、可擴展性與可商用性。它的流程大致如下： 1. 使用者輸入問題（例如：「抖音是否影響台灣選舉？」） 2. Gemini LLM 幫你想出關鍵字（不只是照抄問題） 3. 呼叫 Google Search API 抓資料 4. LangGraph 控制流程 → 判斷資料夠不夠 → 若不足，自動補查 5. 整合最終答案，並產生 citation（來源說明）你可以想像這就像一位實習助理幫你寫報告，不只輸出一段內容，而是會去查、會判斷、會補資料，而且說明「我為什麼這樣說」。 LangGraph 是什麼角色？ LangGraph 就是整個 Agent 背後的控制系統。用白話講，它幫你定義 AI 每一步要幹嘛、遇到什麼狀況該走哪條路、要不要反思、要不要再查，甚至可以定義條件邏輯與資料流動。這就不像寫一個單純的 Chat API，而是比較像「把一個流程圖變成可以跑的程式」。對工程師來說，它提供了從 prompt 到流程控制的設計彈性；對產品設計來說，它讓 AI 有了「多步驟任務執行」的能力。技術架構與使用方式這整套系統是 Fullstack 架構，前後端都幫你整好了，技術選型也非常實用：前端：Vite + React + TailwindCSS + Shadcn UI 後端：FastAPI + LangGraph...

繼續閱讀>>

熱血漢誌 - 技術新鮮人到技術經理人，必懂的事

搜尋此網誌