跳到主要內容

發表文章

目前顯示的是 12月, 2025的文章

AI代理的協作革命:Anthropic的雙代理系統與外部記憶策略

在人工智慧(AI)代理能力日益增強的時代,開發者們對其寄予厚望,期待它們能獨力承擔需要數小時甚至數天才能完成的複雜任務,例如開發一款完整的軟體應用程式。然而,這些雄心壯志卻常常在一個關鍵環節上受挫:AI代理難以在多個「上下文視窗」(Context Window)之間保持連貫的記憶與進度。這好比一場馬拉松接力賽,每位接力者卻對前一位跑者的努力一無所知,導致工作無法無縫銜接。Anthropic 工程團隊的最新研究,正是為了解決這項核心挑戰,提出了一套借鑒人類軟體工程最佳實踐的「有效控制架構」(Effective Harnesses)。 這項突破性研究的核心觀點並非等待一個擁有無限記憶的「超級模型」問世,而是將重心從單純追求模型能力,轉向系統工程與流程設計的重大典範轉移。正如奧斯卡·王爾德(Oscar Wilde)所言:「記憶…是我們每個人隨身攜帶的日記。」對於缺乏內建持久記憶的AI代理而言,外部的「日記」與「工作日誌」便成了其維繫連貫性的關鍵。 AI代理的「失憶症」:長時間運作的核心障礙 儘管諸如 Claude 3.5 Sonnet 等頂尖大型語言模型(LLMs)擁有強大的單次互動能力,但在面對「建立一個 claude.ai 的複製品」這樣的高層次、長週期指令時,它們往往會遭遇滑鐵盧。其根本原因在於上下文視窗的物理限制,導致代理在每次新的互動會話(Session)開始時,便會「失憶」,忘記之前已經完成的工作與決策。 研究歸納出幾種主要的失敗模式: 一次性完成所有工作(One-shotting):代理傾向於試圖在單一上下文視窗內完成過多任務。這猶如要求一位工程師在沒有任何筆記或休息的情況下,獨自從頭到尾寫完整個專案。結果往往是在中途耗盡記憶體,留下未完成、無文檔的半成品,導致後續的代理實例需要花費大量時間去猜測和修復。 過早宣告完成(Premature Completion): 當後續代理實例看到部分已實現的功能後,可能會錯誤地判斷整個專案已經結束,從而停止工作,導致專案最終未能達到預期目標。 缺乏上下文的錯誤修復: 當代理產生的程式碼存在錯誤(Bug)時,新的代理實例由於缺乏完整的歷史記錄,難以定位和修復問題,甚至可能在修復過程中引入新的錯誤。 環境不一致:代理在每次啟動時,都可能需要花費大量時間重新探索和設置開發環境,這不僅降低了效率,也增加了出錯的風險。 Anthr...