What is Mahilo?
构建复杂的、集成人类监督的多智能体 AI 系统可能是一项艰巨的任务。而mahilo则能简化这个过程。它是一个灵活的 Python 框架,旨在让您创建和管理 AI 智能体团队,这些智能体可以相互通信、共享上下文信息,并直接与人类用户进行实时交互。如果您需要具备人类监督的协调式 AI,那么mahilo将为您提供坚实的基础。
主要特性:
🗣️ 支持实时人机交互: 通过 WebSockets 将人类用户连接到各个智能体,从而实现自然流畅的双向对话(文本或语音!)。
🤝 促进智能体协作:
mahilo团队中的智能体可以直接通信,共享上下文并协调行动,以解决复杂的问题。⚙️ 自定义智能体能力: 通过扩展
BaseAgent类,轻松创建新的智能体,定义其角色、描述、工具和通信权限。🧩 集成现有智能体: 将来自其他框架(如 LangGraph)的智能体无缝集成到您的
mahilo团队中。🚦 控制通信流: 使用
can_contact列表来定义哪些智能体可以交互,从而创建分层或对等通信结构。💾 维护对话上下文:
mahilo自动管理和共享智能体之间最近的 N 个对话,确保每个人都及时了解情况。会话管理允许持久保存对话历史记录。⚡ 动态激活智能体: 智能体仅在需要时才会被激活,从而优化资源利用率。
💻 轻松测试和交互: 使用内置的 CLI 客户端(
mahilo connect)快速连接到您的智能体并与之交互(文本或语音)。
技术细节:
安装: 通过 pip 轻松安装:
pip install mahilo(或者对于语音功能,使用pip install mahilo[voice],需要预先安装 PyAudio)。WebSocket 服务器:
mahilo利用 FastAPI 的 WebSocket 支持来实现智能体和客户端之间的实时双向通信。智能体管理器:
AgentManager类处理智能体注册、通信管理和上下文共享。基础智能体:
BaseAgent类提供核心功能,包括消息处理、消息队列、工具集成和会话管理。集成: 设计用于与其他智能体框架集成。该示例演示了集成 LangGraph 智能体。
用例:
应急响应协调: 设想这样一种情况:一位医疗顾问智能体识别出公共卫生紧急事件。使用
mahilo,该智能体可以同时向物流协调员智能体(管理资源)和公共沟通主管智能体(传播信息)发出警报并与之协调,所有这些都在人为监督下进行。客户服务交接: 一个使用
mahilo构建的客户服务智能体可以将复杂的客户问题无缝地转移给专门的技术支持智能体,确保自动共享所有相关的对话历史记录。人类客服人员监督整个过程。调度和现场服务: 调度员智能体可以接收请求,并使用
mahilo的分层通信结构来协调多个现场服务智能体(例如,水管工、电工)的行动。多个调度员可以连接到同一个智能体,接收更新和协调行动。
结论:
mahilo为构建需要实时通信、人为监督和无缝上下文共享的复杂多智能体系统提供了一个强大而灵活的基础。其模块化设计和易于使用的 API 使其成为开发人员应对复杂协调挑战的理想选择。





