What is Devstral?
对于软件工程师而言,解决大型代码库中的复杂问题,需要的不仅仅是生成代码片段。你需要的是能够理解上下文、识别组件之间关系、并能帮助定位细微错误的 AI,本质上,你需要的是一个能够真正成为工程伙伴的 AI。传统的 LLM 在处理原子任务方面表现出色,但往往难以应对这些现实世界的挑战。
因此,我们推出了 Devstral,这是一款专为软件工程任务设计的 Agentic LLM。Devstral 由 Mistral AI 和 All Hands AI 合作开发,在真实的 GitHub 问题上进行了训练,能够处理实际开发工作流程的复杂性。它旨在与代码 Agent 支架集成,使其能够与你的代码库交互并帮助有效地解决问题。
Devstral 经过精心设计,可在对开发者而言最重要的方面提供强大的性能,为自动化复杂的编码任务和增强你的工程能力提供强大的工具。
主要特性
🤖 执行 Agentic 编码: Devstral 在真实的 GitHub 问题上进行了训练,旨在处理超出简单代码生成范围的复杂、多步骤软件工程任务,并能有效地与 Agent 支架协同工作。
📊 提供强大的基准性能: 在 SWE-Bench Verified 上取得了 46.8% 的分数,超越了之前最先进的开源模型 6% 以上,并在这一具有挑战性的数据集上超过了 GPT-4.1-mini 等模型 20% 以上。
💡 轻量级且易于访问: Devstral 拥有 240 亿个参数,专为易用性而设计,能够在单个 RTX 4090 或具有 32GB RAM 的 Mac 上本地运行。
📜 在 Apache 2.0 许可下可用: 以宽松的开放许可提供,允许你不受限制地使用、修改和构建 Devstral,用于商业和非商业目的。
🧠 处理广泛的上下文: 具有 128k 的上下文窗口,使模型能够有效地理解并在大型代码库中工作。
⚙️ 利用高级分词器: 采用具有 131k 词汇量的 Tekken 分词器,以实现高效的代码处理。
用例
本地项目中的自动错误修复: 将 Devstral 与 OpenHands 等本地 Agent 支架集成,以自动分析项目问题跟踪器中报告的问题,提出跨多个文件的代码更改,甚至测试修复程序,所有这些都在你的本地机器上私下运行。
增强敏感企业代码库的开发: 在你企业的安全环境中部署 Devstral,以利用其 Agentic 功能来自动化诸如依赖项更新、重构或修复专有或隐私敏感代码上已识别的漏洞等任务,这些代码不能暴露给外部服务。
构建高级 AI 编码助手: 如果你正在开发 IDE 插件、自定义编码环境或内部开发人员工具,请将 Devstral 纳入你的模型选择中,以支持需要理解代码上下文、规划多步骤解决方案以及与开发工作流程交互的高级功能。
结论
Devstral 为软件工程师提供了一个强大的 Agentic AI 模型,能够应对现实世界的编码挑战。它在基准测试中的强大性能,以及其轻量级特性和开放的 Apache 2.0 许可,使其成为个人开发者、企业和团队构建下一代编码工具的多功能工具。无论你需要本地自动化、安全的企业解决方案,还是为你的 AI 助手提供强大的引擎,Devstral 都能为你提供一个引人注目的选择,以增强你的软件开发工作流程。





