What is Cloudflare AutoRAG?
打造真正理解您特定資料的人工智慧應用程式,像是內部文件、產品規格、支援文章等,通常需要透過複雜的「檢索增強生成」(Retrieval-Augmented Generation,RAG)流程。雖然 RAG 功能強大,但傳統上設定和維護 RAG 系統需要同時處理資料儲存、向量資料庫、嵌入模型、大型語言模型(LLM),以及用於建立索引和檢索的複雜程式碼。這是一項重要的任務,可能會分散您建構實際應用程式的注意力。
Cloudflare AutoRAG 簡化了整個流程。它提供一個完全託管、自動化的 RAG 管道,建立在 Cloudflare 的基礎架構之上。您連接您的資料來源,例如 Cloudflare R2 儲存桶,AutoRAG 會處理繁重的工作,從處理您的資料並建立索引,到檢索相關資訊並產生具有上下文意識的人工智慧回應。這讓您可以將特定的知識注入到您的應用程式中,而無需陷入複雜的基礎架構管理或持續的手動更新。
主要功能
📥 自動化資料擷取: 直接連接到您的 Cloudflare R2 儲存桶,自動讀取各種檔案類型(PDF、文字、HTML 等)。您只需將 AutoRAG 指向您的資料即可。
✂️ 智慧內容分塊: 自動將大型文件分解為更小、更易於管理的部分,這些部分經過最佳化,可供人工智慧有效地檢索資訊。
🧠 智慧嵌入: 使用在 Workers AI 上執行的有效嵌入模型,將文字塊轉換為向量表示,使您的資料可以根據語義進行搜尋。
💾 託管向量儲存和索引: 將這些向量安全地儲存在為您建立和管理的專用 Cloudflare Vectorize 資料庫中,無需手動設定即可建立可搜尋的索引。
🔄 持續同步: 主動監控您連接的 R2 儲存桶中是否有新的或更新的檔案,自動重新處理內容並重新建立索引,以保持您人工智慧知識庫的最新狀態。
💬 整合式 LLM 生成: 無縫使用 Workers AI 大型語言模型,根據檢索到的資訊和使用者的查詢產生相關且有根據的回應,完成 RAG 迴圈。
實際應用案例
AutoRAG 使您能夠快速建構更智慧的人工智慧應用程式。請考慮以下情境:
內部知識助理: 想像一下,部署一個內部聊天機器人,員工可以向它詢問有關公司政策、專案文件或儲存在 R2 中的技術程序的問題。AutoRAG 確保機器人僅根據您經過驗證的內部文件(而不是通用的網路知識)提供準確的答案。
具有上下文意識的客戶支援機器人: 建構一個超越罐頭回應的支援機器人。透過 R2 將您的產品手冊、常見問題解答和疑難排解指南提供給它,AutoRAG 使機器人能夠準確地回答特定的客戶問題,並自動參考最新的資訊。
跨網站內容的語義搜尋: 需要讓您的網站內容可以透過自然語言輕鬆搜尋嗎?您可以使用 Cloudflare 的 Browser Rendering API 將您網站的頁面擷取為 HTML,將其儲存在 R2 中,然後連接 AutoRAG。然後,使用者可以提出諸如「X 功能如何運作?」之類的問題,並獲得直接從您的網站內容中得出的精確答案。
結論
Cloudflare AutoRAG 消除了通常與實施「檢索增強生成」相關的重大營運負擔。透過自動化整個管道(從資料擷取和處理到向量儲存和人工智慧回應生成),它可以讓您將精力集中在建立利用您獨特資料的創新人工智慧應用程式上。AutoRAG 建立在 Cloudflare 可靠且可擴展的基礎架構之上,提供了一條簡化的途徑來建構更智慧、具有上下文意識的人工智慧體驗。
常見問題解答 (FAQ)
Q1:Cloudflare AutoRAG 到底是什麼?
AutoRAG 是 Cloudflare 上的一項完全託管服務,可自動建立和維護「檢索增強生成」(RAG) 管道。它連接到您的資料(最初在 R2 中),處理索引、向量儲存(使用 Vectorize)、檢索,並使用 Workers AI 來產生基於您資料的回應。
Q2:在公開測試期間,AutoRAG 的費用是多少?
在公開測試期間,啟用和使用 AutoRAG 服務本身是免費的。但是,AutoRAG 會使用您帳戶中的其他 Cloudflare 資源(例如 R2 用於儲存、Vectorize 用於向量資料庫,以及 Workers AI 用於處理/生成),這些資源將根據標準 Cloudflare 使用費率收費。
Q3:在測試期間有任何限制嗎?
是的,為了在測試階段管理資源,每個 Cloudflare 帳戶最多可以建立 10 個 AutoRAG 實例。每個實例目前可以處理連接的 R2 儲存桶中最多 100,000 個檔案的索引。
Q4:AutoRAG 可以處理哪些類型的資料?
目前,AutoRAG 直接與 Cloudflare R2 儲存桶整合。它可以處理這些儲存桶中常見的檔案類型,包括 PDF、文字檔案、HTML、CSV,甚至圖像(使用視覺模型來產生文字描述)。您也可以使用 Browser Rendering API 先將頁面儲存到 R2,從而擷取網路內容。計畫支援其他資料來源,例如直接 URL 和 Cloudflare D1。
Q5:我需要手動設定或管理 Vectorize 資料庫或 Workers AI 模型嗎?
不用,這是 AutoRAG 的核心優勢。它會自動佈建和管理必要的 Vectorize 資料庫實例,並協調整理 Workers AI 模型的使用,以進行嵌入和生成,作為託管管道的一部分。您與 AutoRAG 服務互動,它會處理底層元件。





