Khoj(發音類似「Khoj」,意為「發現」或「探索」)是一款 開源、自託管(self-hostable)的 AI 第二大腦(Second Brain)與研究副駕駛(Research Copilot),被許多極客(geek)、開發者、研究者與隱私愛好者視為 首選的開源深度 RAG 引擎。它從 2021 年開始開發,2026 年已相當成熟,能讓你用自然語言查詢自己的筆記、文件、程式碼庫,並結合網路進行深度研究,完全控制資料隱私。

官方網站:https://khoj.dev/
GitHub:https://github.com/khoj-ai/khoj (活躍開源專案)
雲端試用:https://app.khoj.dev/

主要功能與特性(極客最愛之處)

Khoj 的核心是 先進 RAG(Retrieval-Augmented Generation)管道,結合語義搜尋、混合檢索(vector + keyword)、迭代發現(iterative discovery),遠勝傳統關鍵字搜尋。特別適合學術文件處理、個人知識管理與深度研究。

  • 強大 RAG 與搜尋
    • 支援 PDF、Markdown、Org-mode、Notion、Word、圖片、程式碼、GitHub repo 等多種來源。
    • 語義搜尋 + 增量搜尋(search-as-you-type),速度快、理解意圖,即使你記不清確切關鍵字也能找到相關內容。
    • 線上/離線混合:可自動決定是否需要上網補充最新資訊(支援 SearxNG),並總是顯示引用來源。
    • 研究模式(/research):觸發深度研究工作流,自動閱讀多份文件、比較觀點、生成帶引用(citations)的文獻回顧。
  • AI 聊天與生成
    • 連接任意 LLM:本地模型(Ollama + Llama 3、Mistral 等)、雲端模型(Claude Sonnet 4.6 / Opus 4.6、OpenAI、Gemini、HuggingFace)
    • 自訂 Agents:建立有個性、工具與專屬知識庫的代理人,可排程自動化(例如每週研究通訊、智能通知)。
    • 多模態:處理文字 + 圖表 + 程式碼,生成內容、總結長文、輔助創作。
  • 整合與跨平台
    • 完美支援 Obsidian、Emacs、Desktop App、Web、WhatsApp,甚至手機。
    • 與 Heptabase 互補:Heptabase 做視覺白板與卡片整理,Khoj 做深度後端 RAG 查詢與合成(可透過 API/MCP 連接)。
    • 與 Claude Sonnet 4.6 搭配極佳:讓 Khoj 當 RAG 前端(索引你的學術論文庫),用 Sonnet 4.6 做高性能 Generator,實現 1M 上下文級別的學術深度推理,同時保留隱私與自訂性。
  • 其他極客特性
    • 完全自託管:資料永遠留在本地或你的伺服器,可離線使用。
    • 可擴展:從單機(on-device)到企業級(cloud-scale),支援 Docker 一鍵部署、Postgres 後端。
    • 隱私至上:不強迫上傳資料到大廠雲端,適合敏感學術或企業文件。
    • 迭代發現與輔助創造:不僅回答問題,還幫助你重新發現舊筆記、腦力激盪新想法。

優點(為什麼極客首選)

  • 開源(AGPLv3),可完全客製、修改、審核程式碼。
  • 成本低:自託管幾乎免費(只付硬體/電費)。
  • 比純 Claude Projects 更靈活:支援超大本地知識庫、混合線上搜尋、自訂 pipeline。
  • 在學術 RAG 上表現出色:處理大量 PDF 論文、提取表格/圖表、跨文件合成、生成可驗證引用。

缺點

  • 自託管有技術門檻(需 Docker、設定 LLM、可能需要 GPU 加速本地模型)。
  • 雲端版較方便,但自託管才是其靈魂。
  • 部分用戶反饋早期本地性能需優化(但 2026 年版本已大幅改善)。

價格方案(2026 年最新)

  • 自託管版完全免費(開源)。你只需準備伺服器(推薦 4GB+ RAM、GPU 更好用 Ollama)、Docker 或 Pip 安裝。硬體成本依規模而定(個人筆電或 VPS 幾十美元/月即可)。
  • 雲端版(app.khoj.dev:提供方便的託管服務,有免費額度 + 付費方案(具體依用量,適合不想維護伺服器的人)。詳細價格請直接到官網查看(通常比大廠訂閱便宜)。
  • LLM 成本:如果你用本地模型(如 Ollama),幾乎零額外費用;搭配 Claude Sonnet 4.6 API 則依 token 計費(與之前討論相同)。

與 Claude Sonnet 4.6 + Heptabase 的比較(學術文件 RAG 情境)

  • Claude Sonnet 4.6:最簡單、開箱即用的 1M 長上下文 RAG,適合個人快速上傳論文、深度推理。但資料需上傳到 Anthropic,隱私較低,且對超大自有知識庫(數百篇論文)需依賴 Projects。
  • Heptabase:視覺化前端王者(白板、卡片連結),適合整理知識圖譜,但 RAG 深度推理不如專門引擎。
  • Khoj極客/自託管首選。它專攻「自己的資料 + RAG」,可把 Heptabase 卡片或大量 PDF 索引進去,再用 Claude 4.6 當後端,實現「視覺 + 深度 + 隱私」三合一。對論文庫很大、需要長期自訂、或重視資料不離開本地的人來說,Khoj 的性價比與控制力最高。

推薦學術 Workflow

  1. 用 Heptabase 整理論文卡片與視覺連結。
  2. 把 PDF/筆記匯入 Khoj(自託管),建立語義知識庫。
  3. 在 Khoj 中用 /research 模式 + Claude Sonnet 4.6,問「比較這 15 篇論文的方法論差異,並生成帶引用的 Discussion」。
  4. 結果可直接匯出或推回 Heptabase 白板。

Khoj 非常適合你之前的學術文件 RAG 需求,尤其是想避開純雲端工具、追求深度與客製化的極客路線。

想看自託管安裝步驟、具體 Prompt 範例、還是與 Obsidian + Claude 的詳細比較?或者告訴我你的硬體環境(有 GPU 嗎?論文數量?),我可以給更精準的部署建議!直接去 https://docs.khoj.dev/ 就能開始試用。