2025年30个最好的 Phi-3 Mini-128K-Instruct ONNX 替代方案

ONNX Runtime

ONNX Runtime：随时随地，更快运行机器学习模型。加速跨平台推理与训练。支持 PyTorch、TensorFlow 等框架！

机器学习免费

ONNX Runtime 替代方案

9

Phi-2 by Microsoft

Phi-2 是一款针对机械可解释性、安全改进和微调实验等不同领域探索的理想模型，供研究人员使用。

大语言模型免费

Phi-2 by Microsoft 替代方案

41

local.ai

探索本地AI Playground，一款免费的离线AI实验应用。其功能包括CPU推理、模型管理等。

开发者工具免费

local.ai 替代方案

6

MiniCPM3-4B

MiniCPM3-4B 是 MiniCPM 系列的第三代模型。MiniCPM3-4B 的整体性能超越 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125，与许多最近的 7B~9B 模型相当。

大语言模型免费

MiniCPM3-4B 替代方案

0

Gemma 3 270M

Gemma 3 270M：小巧轻便、极致高效的人工智能，专精于特定任务。可微调以实现精准指令遵循，并支持低成本的设备端部署。

大语言模型免费

Gemma 3 270M 替代方案

12

Nexa AI

无需进行模型压缩或边缘部署的繁琐流程，即可在设备端构建高性能 AI 应用。

机器学习免费

Nexa AI 替代方案

4

Netmind Power

NetMind：您的一站式AI平台。凭借丰富的多元模型、强劲的GPU算力以及经济高效的工具，助您轻松构建、弹性部署，并实现规模化扩展。

机器学习付费

Netmind Power 替代方案

5

Nexa.ai

Nexa AI 助力在任何设备上轻松部署高性能、隐私保护的生成式AI。以无与伦比的速度、卓越的效率，同时确保设备本地隐私，助您加速构建。

开发者工具免费增值

Nexa.ai 替代方案

4

MiniMax-M1

MiniMax-M1：开放权重AI模型，具备百万级token上下文窗口及卓越的深度推理能力。高效处理海量数据，赋能各类先进AI应用。

大语言模型免费

MiniMax-M1 替代方案

1

GGML

ggml 是一个用于机器学习的张量库，能够在商用硬件上实现大型模型和高性能。

开发者工具免费

GGML 替代方案

6

MiniMind

从零开始构建人工智能模型！MiniMind 助您在单张 GPU 上经济高效地进行 LLM 训练。学习 PyTorch，打造您专属的 AI。

机器学习免费

MiniMind 替代方案

1

Nemotron-4 340B

Nemotron-4 340B 是一个针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列，包含最先进的指令和奖励模型，以及一个用于生成式 AI 训练的数据集。

大语言模型免费

Nemotron-4 340B 替代方案

0

EXAONE 3.5

探索LG AI Research推出的EXAONE 3.5。这是一套双语（英语和韩语）指令调优生成式模型，参数范围从24亿到320亿。支持长达32K标记的长上下文，在现实场景中表现卓越。

大语言模型免费

EXAONE 3.5 替代方案

0

Neural Magic

Neural Magic 提供高性能推理服务，专为开源大型语言模型 (LLM) 而设计。降低成本，增强安全性，轻松扩展。可在各种环境中的 CPU/GPU 上部署。

机器学习付费

Neural Magic 替代方案

7

Gemma 3n

Gemma 3n 将强大的多模态人工智能带到边缘端。即使在内存受限的设备上，也能高效运行图像、音频、视频和文本等多模态AI任务。

大语言模型免费

Gemma 3n 替代方案

0

Reka Flash 3

Reka Flash 3：低延迟、开源的 AI 推理模型，专为快速高效的应用程序而生。赋能聊天机器人、端侧 AI 及 Nexus。

大语言模型免费

Reka Flash 3 替代方案

1

Clika.io

使用 CLIKA ACE，将 AI 模型缩小 87%，速度提升 12 倍。自动化压缩，实现更快、更经济的硬件部署。保证精度不损失！

开发者工具免费试用

Clika.io 替代方案

4

Mistral Small 3

Mistral Small 3 (2501) 在70B参数以下的“小型”大型语言模型类别中树立了新的标杆，它拥有24B参数，并实现了与更大模型相当的、最先进的功能！

大语言模型免费

Mistral Small 3 替代方案

0

Novita.ai

告别AI基础设施的困扰。Novita AI 凭借200多个模型、定制选项以及无服务器GPU云，简化了AI模型的部署与扩展。助您省时省钱。

开发者工具付费

Novita.ai 替代方案

3

ktransformers

KTransformers 是由清华大学 KVCache.AI 团队和 QuJing Tech 共同开发的开源项目，旨在优化大型语言模型的推理过程。它能够降低硬件门槛，在 24GB 显存的单 GPU 上运行 6710 亿参数的模型，并提升推理速度（预处理速度高达 286 tokens/s，生成速度高达 14 tokens/s），适用于个人、企业和学术用途。

机器学习免费

ktransformers 替代方案

1