What is LEANN?
LEANN 是一款創新的向量資料庫,旨在普及高效能與個人化的AI。它透過將您的個人裝置轉變成強大的檢索增強生成(RAG)系統,解決了傳統向量解決方案在複雜性和成本方面的關鍵挑戰。對於需要處理大量私人資料的開發者和個人AI使用者,LEANN 提供了快速、準確、100% 私密的 RAG 功能,且無需任何雲端費用,效率更是無與倫比。
主要特色
LEANN 的架構以效率與隱私為核心,使消費級硬體也能具備企業級的搜尋能力。
💾 最小向量索引與極致儲存空間節省
LEANN 旨在將資源消耗降至最低,相較於傳統向量資料庫,儲存空間減少了驚人的 97%,且不損及搜尋準確度。這種高效率是透過 基於圖形化選擇性重計算 (Graph-based Selective Recomputation) 實現的。這項創新技術能按需計算嵌入(embeddings),而非儲存大量靜態嵌入向量,從而徹底消除了龐大的儲存開銷。
🔒 100% 私密的 RAG,零雲端費用
確保您的資料擁有完整主權。LEANN 讓您的 RAG 應用程式完全在個人筆記型電腦上運行,這表示您的敏感資料永遠不會離開您的裝置。這種徹底的本地化消除了對外部雲端服務、第三方 API(例如 OpenAI)以及相關費用的依賴,從而保證了 零雲端費用 和全面的資料隱私。
📚 RAG 涵蓋一切:全面的資料擷取
LEANN 將您零散的個人資料來源轉化為統一且可搜尋的知識庫。它支援對各種資料進行 RAG,包括標準文件(.pdf、.txt、.md)、專有通訊記錄(Apple Mail、WeChat、iMessage)、網路瀏覽歷史,以及複雜的代理記憶(ChatGPT/Claude 對話),讓您能夠查詢完整的個人數位歷史。
💻 針對開發者的智慧程式碼分塊
針對開發者,LEANN 提供原生的 Claude Code 整合以及智慧型 AST 感知程式碼分塊 (AST-Aware Code Chunking)。這項功能能夠自動理解並保留 Python、Java 和 TypeScript 等程式語言中程式碼的語義邊界(例如函數、類別和方法),進而實現高度準確、具備上下文感知能力的語義程式碼搜尋與協助。
⚙️ 彈性配置與可擴充的後端
LEANN 提供了簡潔的 Python API 和強大的命令列介面(CLI),具備彈性參數可配置嵌入模型、搜尋策略和資料處理。它支援流行的 LLM 後端(HuggingFace、Ollama 以及任何與 OpenAI 相容的 API),並允許使用者選擇可插拔的索引後端,例如 HNSW(預設)和 DiskANN。
應用場景
LEANN 賦予使用者從其最私密且複雜的資料集中,即時獲得可執行的洞察。
1. 個人知識統一與搜尋
將您多年來分散的數位通訊——從 Apple Mail 和 iMessage 對話,到瀏覽器歷史紀錄和歸檔文件——整合進一個單一的語義搜尋引擎。您可以基於您完整的個人數位足跡,提出複雜的問題,並檢索到高度相關的答案,真正實現 像 Google 一樣搜尋您的生活。
2. 進階程式碼庫導航與上下文感知協助
開發者可以索引龐大的程式碼儲存庫,並即時對其整個程式碼庫進行語義搜尋。AST 感知分塊確保了在請求上下文或除錯協助時,RAG 系統能檢索到完整且語義相關的函數或類別,從而提供高度準確的上下文感知協助,無需手動注入上下文。
3. 精密的資料管理與篩選
利用內建的中繼資料篩選系統,精確地管理和查詢您的索引資料。舉例來說,您可以依據特定日期或類型篩選文件,或按檔案副檔名進行高度目標導向的程式碼搜尋。這實現了許多複雜的應用場景,例如找出上個月在特定專案中編寫的所有 Python 函數,或是使用隨附的 Grep Search 選項快速定位精確的詞句。
結論
LEANN 是實現高效能、私密且具成本效益的個人 AI 的終極解決方案。透過運用創新的圖形化重新計算技術,它不僅具備可擴展向量資料庫的強大功能,同時也確保了完整的資料隱私和最低的資源消耗。





