近來 AI Agent 成為熱門話題,但它究竟是什麼?本文將以「OpenClaw」(龍蝦)為例,由淺入深帶你剖析 AI Agent 的運作原理,讓你一次搞懂這個強大的人工智慧助理。
【一、 什麼是 AI Agent?它跟一般 AI 有何不同?】
平時我們使用的 AI(例如 ChatGP、Gemini)就像是一位「只動口不動手」的指導教授,當你提出需求時,它只能給你建議或步驟,無法直接幫你執行。
相反地,AI Agent(人工智慧代理)是一個能夠「自主運行」並「動手做事」的系統。只要給予它一個目標,它就能自動完成複雜的任務。舉例來說,當你命令它去經營一個 YouTube 頻道時,它不僅能自行上網收集資料、製作投影片、寫講稿、呼叫語音合成工具配音,甚至還能自己繪製大頭貼並將影片上傳至 YouTube。在這整個過程中,人類只需要負責審核即可。
【二、 拆解龍蝦的大腦:AI Agent 的底層邏輯】
很多人誤以為 AI Agent 本身就是一個超級聰明的語言模型,但事實並非如此。AI Agent 其實是「語言模型以外的部分」,它是一個跑在電腦上、介於「人類」與「雲端語言模型」之間的「介面」或「框架」。
語言模型(LLM)的本質只會做一件事:文字接龍(預測下一個字)。語言模型就像一個被關在黑盒子裡的人,沒有記憶、沒有日曆、看不到外面,只能根據從門縫塞進來的半截句子,猜測後面該接什麼字。
那麼,AI Agent 是如何讓這個「只會文字接龍的黑盒子」變成無所不能的助理呢?秘密就在於以下幾個機制:
1. 系統提示詞(System Prompt)與人格設定AI Agent 在與語言模型溝通前,會先把電腦裡記載著它「靈魂」的文字檔(例如 .md 檔,裡面寫著它的名字、人生目標、主人的偏好等)讀取出來,組合成一段非常長的「系統提示詞」附加在你的指令前面。語言模型看到這段長長的前言後,在做文字接龍時,自然就會表現得好像它擁有人格一樣。
2. 克服失憶症:記憶系統語言模型每次對話都會「重新啟動」,完全不記得過去發生的事。為了讓它擁有記憶,AI Agent 會把過去的對話紀錄一併貼給語言模型看。當記憶越來越多時,AI Agent 甚至會啟動「記憶檢索(RAG)」機制,把歷史文字檔切成小區塊,透過計算相似度找出最相關的記憶片段餵給語言模型。
【三、 讓 AI 長出雙手:工具(Tools)與技能(Skills)】
AI Agent 之所以能操控你的電腦,是因為框架中內建了各種「工具」。
– 工具的運作方式: 當語言模型讀完包含「工具使用手冊」的系統提示詞後,它會回傳一段特殊指令(例如:請使用 Read 工具打開 answer.txt)。AI Agent 框架本身沒有智慧,它只會像個機器人一樣,乖乖在你的電腦上執行這個指令,並把讀取到的結果再次貼給語言模型看,讓語言模型繼續做「文字接龍」以決定下一步。
– 技能(Skill): 這是 AI Agent 執行任務的「標準作業流程(SOP)」。如果任務太複雜,Agent 可以把步驟寫成文字檔儲存起來,下次要用時再隨需讀取(按需載入),藉此節省語言模型的上下文長度(Context Window)限制。
【四、 高階機制:心跳、排程與分身】
為了讓 AI Agent 能夠 24 小時不間斷地自主運作,設計了許多巧妙的進階機制:
– 分身(Sub-agent): 當任務需要閱讀大量論文或進行繁雜的網頁搜尋時,一次把所有資料塞給語言模型會導致它能力下降或超過字數限制。為了解決這個問題(稱為 Context Engineering),主要的龍蝦可以召喚出「小龍蝦(子代)」,讓小龍蝦去處理閱讀與總結的瑣事,最後主龍蝦只需要看「摘要」即可。為了避免小龍蝦無限繁殖導致系統崩潰,框架會強制剝奪小龍蝦的「生育能力」。
– 心跳機制(Heartbeat): 一般的 AI 你不講話它就不理你,但 AI Agent 的框架會被設定為「每隔一段時間(例如 15 或 30 分鐘)自動戳一下語言模型」。這讓 AI Agent 能夠主動去推進它的人生目標,甚至定時向你報告進度。
– 排程系統(Cronjob)與等待: 透過排程,AI Agent 學會了「等待」。例如當它使用其他 AI 工具生成影片時,如果畫面顯示「生成中」,它能設定一個「3分鐘後再來檢查」的排程,時間到了再自動接續下載任務,順利完成複雜的跨平台操作。
– 上下文壓縮(Context Compression): 當長期運作導致對話紀錄太長時,AI Agent 會呼叫語言模型將舊的對話「寫成摘要」,並用摘要替換掉原本的冗長紀錄,讓大腦隨時保持清爽。
【五、 新手必看:AI Agent 的安全守則】
AI Agent 擁有強大的力量,因為它可以執行任何電腦指令,但這也帶來了極大的風險。如果語言模型「發瘋」,或者讀取到了網頁上惡意植入的指令(Prompt Injection,例如駭客在 YouTube 留言叫它刪除所有檔案),它可能會把你的電腦清空。
因此,如果你打算開始「飼養」一隻龍蝦,請務必遵守以下安全守則:
1. 隔離環境: 絕對不要把 AI Agent 安裝在你平時存放重要資料的電腦上。請準備一台新電腦或將舊電腦格式化,把它當作獨立的助理給它專屬的使用空間。
2. 帳號分離: 不要給它你私人的帳號密碼,幫它申請一組專屬的 Google 或 GitHub 帳號,讓它獨立做事。
3. 審核機制: 在系統設定中開啟「人類同意(Human in the loop)」功能。當 AI Agent 想要執行高風險指令時,系統會跳出視窗,必須等你按下「同意」它才能動手。
4. 注意來源不明的技能: 網路上有許多別人寫好的 Skill 可以下載,但其中可能夾帶木馬程式或病毒。當 Agent 想要下載壓縮檔時,務必要提高警覺。
總結來說:
AI Agent 就像是一個剛進公司的實習生,它有極強的學習與執行能力,但同時也可能因為不清楚規則而犯錯。我們不需要因為害怕而拒絕使用它,而是應該為它打造一個安全的「沙盒環境」,並設定好安全準則,讓它在容錯的空間中為你發揮最大的價值。