What is Arch?
Arch 是一款基於 Envoy Proxy 的智能第 7 層閘道,專為增強大型語言模型 (LLM) 應用程式(例如 AI 代理、助手和副駕駛)的安全性、可觀察性和個人化而設計,透過管理與 API 的互動來達成。Arch 處理重要的提示相關任務,例如越獄偵測、API 整合以滿足使用者請求、LLM 路由和集中式可觀察性,讓開發人員可以專注於核心應用程式邏輯。
主要功能:
Envoy 基礎:?️ Arch 建立在 Envoy Proxy 之上,利用其強大的 HTTP 管理、過濾和遙測功能,有效處理提示和 LLM 流量。這確保了可擴展性和可靠性,得益於 Envoy 的廣泛採用和已驗證的效能。
快速 LLM 處理:? Arch 利用專門的小型 LLM,針對速度和成本效益優化核心提示相關任務。這些包括重要功能,例如函數/API 呼叫和從使用者提示中提取參數,實現快速有效的應用程式響應。
提示防護:?️ Arch 提供集中式的提示防護措施,作為安全層,防止惡意企圖(例如越獄)並確保安全的使用者互動。這消除了開發人員為每個潛在威脅編寫自定義代碼的需要,簡化了開發並增強了安全性。
流量管理:? Arch 有效地管理 LLM 呼叫,包含智能重試以處理錯誤、LLM 之間的自動切換以確保持續可用性以及彈性上游連接。這確保了平穩運作,並最大程度地減少了個別 LLM 問題造成的干擾。
全面的可觀察性:? Arch 利用 W3C Trace Context 標準,在應用程式中進行全面的請求追蹤,提供與各種可觀察性工具的相容性。它還提供有關延遲、代幣使用量和錯誤率的詳細指標,使開發人員能夠有效地監控和優化 AI 應用程式的效能。
使用案例:
建立一個安全的客戶服務聊天機器人,與計費 API 互動以回答有關發票的問題。
創建一個個性化的旅行代理,使用提示查詢航班和酒店 API,並根據使用者偏好建議行程。
開發一個 AI 驅動的研究助手,可以使用自然語言提示訪問並總結來自各種學術資料庫的信息。
結論:
Arch 透過卸除與提示處理和 LLM 互動相關的重要但差異化任務,使開發人員能夠構建更快、更安全且高度個性化的 LLM 應用程式。透過利用 Arch,開發人員可以專注於核心應用程式邏輯,從而縮短開發週期並改善使用者體驗。如果您希望增強 GenAI 應用程式的效能、安全性以及個人化,Arch 是您需要的解決方案。





