前陣子看到好友 Yuanlin Lin 寫了一篇專門講「什麼是 API、GUI、CLI、MCP」的技術名詞解釋,昨天又幫一個朋友把它的 Claude Code 的 Notion MCP 移除,通通換成 API。
剛好來整理學習筆記,講講要活用 AI Agent,讓它幫你操控軟體工具,你要怎麼選,MCP 可能是個陷阱?
▍先進結論
1. 能用 API 授權,就不需要用 MCP;能用 CLI、MCP,就不要讓 AI 模擬瀏覽器做操作。
2. 為啥?MCP 不是很紅、很猛嗎?因為大部分你在用的工具(Notion、Google、WordPress)都有成熟的 API,功能權限都比 MCP 全面許多,加上一次安裝過多 MCP 給 AI,很佔上下文窗口,API 按需使用,速度更快更省錢。你說讀說明文檔很煩?反正文檔也不是你讀,是讓 AI Agent 去讀。
3. 現在學習、未來選擇數位工具的原則:如果沒有開放 API 的工具,基本都是「不考慮」的。個人資料不開放讓你帶走、運用的,都算流氓工具 XD
—
▍#API — 程式跟程式之間的溝通
你平常怎麼用 Gmail?打開 APP、點收件匣、開信、打草稿內容、按傳送。
但為啥你每按一個按鈕,Gmail 會知道你要做什麼?
因為這背後都在「呼叫 API」。
API,全名 Application Programming Interface(應用程式介面),白話就是:程式跟程式之間溝通的暗號。
Gmail 那個漂亮的畫面,就是一種 GUI(Graphical User Interface,圖形使用者介面),為了讓我們這些大眾普通人好使用,幫你把「呼叫 API」包裝成你看得懂的按鈕而已。
所以現在 AI Agent 能直接呼叫 Gmail API 幫你寄信,我們就不需要讓它繞一圈去開瀏覽器、點撰寫、慢慢填?下面繼續看 ![]()
—
▍#CLI — 普通人害怕的那種黑底白字畫面
CLI,全名 Command Line Interface(命令列介面)。
對,就是普通人覺得工程師常常再看的天書畫面 XD
繼續用 Gmail 舉例。
如果 Gmail 有 CLI,你只要打一行:
gmail send –to boss@company.com –subject “月報” –body “已附上附件”
一行搞定。不用打開 Gmail、不用等載入、不用點撰寫再填四個欄位。
CLI 為什麼在 AI 時代很常被提到?三個理由:指令格式幾乎不會變(不怕 App 改版)、不用開瀏覽器(快很多)、都是簡單英文單字(AI 不容易搞錯)。
—
▍#MCP — 不是什麼都用 MCP 就好
MCP,全名 Model Context Protocol(模型上下文協議),2024 年底 Anthropic(Claude 公司)提出的開放標準。
講白了就是:有人幫你把 API 包裝成一個工具包,讓 AI 拿起來就能用。沒有 MCP 的時候,AI 要自己查文件、搞懂格式、寫程式呼叫。有了 MCP,它從清單挑一個來用,幾秒搞定。
但經過這一年,我的經驗是:MCP 不一定比 API 好。
Notion 官方出的 MCP,功能比 Notion API 少很多;WordPress 也是。所以這兩個我都還是讓 AI 直接用 API,功能權限全開。
你說「可是 API 文檔很難讀」?反正文檔也不是你讀,是 AI 去讀。
建議裝任何 MCP 之前,先問 AI:「這工具的 MCP 跟 API,功能差在哪?我們該用哪個?」它會直接告訴你建議方案。
—
▍#BrowserUse — 真的沒路了才走這條
Browser Use 就是讓 AI 打開瀏覽器,例如透過 Playwright 代理你像真人一樣操作:點按鈕、填表單、截圖。
聽起來很猛?老實說,這是所有方式裡最慢、最不穩定的。
為啥?網頁會改版啊。
今天按鈕在左邊,明天改版搬到右邊,AI 就要花時間去學習,有時候還要滾動畫面來找。簡單來說,你讓 AI 代理瀏覽器操作填寫表單,如果有 API 的話,大概是 30 分鐘 vs 3 秒鐘。
※ 唯一例外:Facebook&Threads 這類社群媒體,通常有大量的 js 渲染,也不開放抓別人貼文的 API,這時候才用會需要用到 Playwright 來讓 AI 慢慢爬文。
—
▍結論:怎麼選?
下次你想讓 AI 幫你自動化、代操某個任務,直接問它:「我去哪裡找 API 或 MCP 給你?你的建議是?」
不過現在你已經有基本知識能判斷:
這個服務有 API 嗎?→ 有就直接用(最快最穩)
有人做好 MCP 嗎?→ 有就裝,但先確認功能夠不夠、會不會太肥大、安全性
有 CLI 工具嗎?→ 讓 AI 替你下指令
以上都沒有?→ Browser Use(最後手段)
Notion、Google、WordPress、GitHub、Slack、Discord 這些主流工具全都有 API。所以大部分情況,不需要走不到第 4 步。
一句話:讓 AI 用它擅長的方式工作(API、CLI),不要逼它學人類的方式工作(看圖點按鈕),果然人類才是障礙本身 XD。
► 另外還有寫一篇關於讓「AI Agent 抓文爬蟲」的策略(工具選擇),我放在「留言處」的完整文章裡。
一張圖弄懂,怎麼讓 AI 操作你的軟體、工具?