What is CleverBee?
在浩瀚的網路資訊大海中,要找到可靠的答案可能會讓人感到不知所措。您可能需要花費數小時篩選搜尋結果,試圖拼湊出一個連貫的理解,同時還要對抗潛在的錯誤資訊或 AI 的「幻覺」。這時, CleverBee 就派上用場了,它提供了一種結構化、透明化的 AI 驅動研究方法。
CleverBee 是一個基於 Python 的研究助理代理程式,作為一個開放原始碼專案,專為對複雜主題感到好奇的任何人而設計。它利用多個大型語言模型 (LLM)、網路自動化和一個清晰的介面,來幫助您徹底探索問題。其目標不僅是獲得答案,更是要理解這些答案是如何推導出來的,並提供清晰的來源引用。由於它是開放原始碼,因此該工具受益於社群的貢獻,隨著時間的推移變得更加強大和多功能。
主要功能:
🧠 專業的多 LLM 策略: CleverBee 將不同的任務分配給不同的 LLM,以獲得最佳結果。它使用 Gemini 1.5 Pro 進行高階規劃和最終報告的整合,使用 Gemini 1.5 Flash 分析研究進度並決定下一步,並使用另一個 Gemini 1.5 Flash 實例來有效率地總結網路內容。這種分工旨在於每個階段都能產生更高品質、更集中的輸出。
🌐 自動化網路研究: 利用 Playwright 根據您的研究主題主動瀏覽網路。它搜尋相關資訊,並從有潛力的頁面中提取原始 HTML 內容。
📊 智慧內容處理: 原始 HTML 會自動清理並轉換為 Markdown 格式。然後,這種結構化的文字會由專用的 LLM 進行總結,使其更容易被規劃代理程式消化並決定後續行動。
🖥️ 互動式使用者介面: 透過 Chainlit 構建的網路 UI 提供了一個清晰的研究過程視窗。您可以即時觀看 CleverBee 規劃其方法、執行步驟,並確切了解它正在查閱哪些來源。
🔧 可擴展的工具整合: 支援模型上下文協定 (Model Context Protocol, MCP),允許整合外部工具以進行專業的資料收集,例如獲取 YouTube 影片文字稿或搜尋學術資料庫。
📈 透明的成本與效能: 具有整合的 Token 追蹤功能,可監控 LLM 的使用情況並估算成本。它還採用基於 SQLite 的快取 (NormalizingCache) 來儲存先前 LLM 呼叫的結果,從而可能加速後續類似的查詢並減少多餘的 API 費用。
⚙️ 可配置且可調整: 根據
config.yaml檔案中定義的設定運作,允許您客製化其行為。其模組化設計支援各種 LLM 提供商,包括 Google Gemini、Anthropic Claude,甚至可以透過llama-cpp-python運作本地 GGUF 模型 (例如 Llama、Mistral、Deepseek),以提高隱私性或離線使用。🌍 開放原始碼且社群驅動: 在 GitHub 上免費提供,您可以檢查程式碼、提出改進建議或直接貢獻其開發。
CleverBee 如何進行研究:一個實際範例
假設您向 CleverBee 提出一個深刻的問題,例如:「人生的意義是什麼?」
CleverBee 不會給出單一的、可能帶有偏見的答案,而是啟動一個結構化的研究計畫:
規劃: 主要的 LLM 概述了一個策略,確定潛在的來源類型(哲學文本、科學文章、專家意見、社群討論)。
執行:
它使用 Playwright 搜尋和存取相關的哲學資源和信譽良好的網站。
它可能會使用 MCP 工具來尋找和轉錄 YouTube 上相關的專家講座。
它可以探索像 Reddit 這樣的論壇,以獲取不同的社群觀點。
另一個 MCP 工具可能會搜尋學術資料庫,以尋找相關的心理學或科學研究。
處理: 從這些來源提取內容,進行清理和總結。
分析: 「下一步」LLM 會審查收集到的摘要,檢查與計畫的進度,並決定是否需要更具體的搜尋。
整合: 最後,主要的 LLM 會編譯這些發現,將來自各種來源的資訊整合到一份平衡的報告中。
報告: 最終輸出提供了一個簡潔的摘要,承認了局限性,並且至關重要的是,包括了所有查閱來源的引用,讓您可以自行驗證資訊。介面顯示 Token 使用量指標,以提高透明度。
重要考量
CleverBee 是一個旨在輔助研究的工具,而不是取代批判性思考或深入的領域專業知識。雖然它旨在將其發現建立在事實來源的基礎上並最大程度地減少偏差,但 AI 模型(即使有特定的指示)仍然可能產生不正確的資訊(產生幻覺)。始終審查提供的來源並交叉參照發現,尤其是在做出關鍵決策時。





