What is Mahilo?
建構複雜、多代理人的 AI 系統,並且能無縫整合人類監督,可能是一項艱鉅的任務。mahilo 簡化了這個流程。它是一個彈性的 Python 框架,旨在讓您創建和管理 AI 代理人團隊,這些代理人可以彼此溝通、共享上下文資訊,並直接與人類用戶互動——所有這些都是即時的。如果您需要具有人類監督的協調式 AI,mahilo 提供了基礎。
主要特色:
🗣️ 啟用即時人類互動: 透過 WebSockets 將人類用戶連接到個別代理人,實現自然、雙向的對話(文字或語音!)。
🤝 促進代理人協作:
mahilo團隊中的代理人可以直接溝通,共享上下文並協調行動以解決複雜問題。⚙️ 自訂代理人能力: 透過擴展
BaseAgent類別,輕鬆創建新的代理人,定義它們的角色、描述、工具和通訊權限。🧩 整合現有代理人: 將來自其他框架(如 LangGraph)的代理人無縫整合到您的
mahilo團隊中。🚦 控制通訊流程: 使用
can_contact列表來定義哪些代理人可以互動,從而創建分層或點對點的通訊結構。💾 維持對話上下文:
mahilo自動管理和共享代理人之間的最後 N 次對話,確保每個人都隨時掌握最新資訊。Session 管理允許持久保存對話歷史記錄。⚡ 動態啟動代理人: 代理人僅在需要時才會啟動,從而優化資源使用率。
💻 輕鬆測試和互動: 使用內建的 CLI 客戶端(
mahilo connect)快速連接到您的代理人並與之互動(文字或語音)。
技術細節:
安裝: 透過 pip 輕鬆安裝:
pip install mahilo(或pip install mahilo[voice]以取得語音功能,並以 PyAudio 作為先決條件)。WebSocket 伺服器:
mahilo利用 FastAPI 的 WebSocket 支援,實現代理人和客戶端之間的即時雙向通訊。代理人管理器:
AgentManager類別處理代理人註冊、通訊管理和上下文共享。基礎代理人:
BaseAgent類別提供核心功能,包括訊息處理、訊息佇列、工具整合和 Session 管理。整合: 旨在與其他代理人框架整合。此範例示範了整合 LangGraph 代理人。
使用案例:
緊急應變協調: 想像一下,一個醫療顧問代理人識別出公共衛生緊急事件的情況。使用
mahilo,此代理人可以同時警示並與後勤協調員代理人(管理資源)和公共傳播主任代理人(傳播資訊)協調,所有這些都在人類監督下進行。客戶服務轉接: 使用
mahilo建構的客戶服務代理人可以將複雜的客戶問題無縫轉移給專業的技術支援代理人,確保自動共享所有相關的對話歷史記錄。人類代理人監督整個過程。調度和現場服務: 調度員代理人可以使用
mahilo的分層通訊結構接收請求並協調多個現場代理人(例如,水管工、電工)的行動。多個調度員可以連接到同一個代理人,接收更新並協調行動。
結論:
mahilo 為建構複雜的多代理人系統提供了一個強大而靈活的基礎,這些系統需要即時通訊、人類監督和無縫的上下文共享。其模組化設計和易於使用的 API 使其成為開發人員應對複雜協調挑戰的理想選擇。





