2025年最好的 LightEval 替代方案
-

使用 OpenAI 格式调用所有 LLM API。使用 Bedrock、Azure、OpenAI、Cohere、Anthropic、Ollama、Sagemaker、HuggingFace、Replicate(100 多个 LLM)
-

Huggingface 的开放式大型语言模型排行榜旨在促进开放式协作和透明度,以评估语言模型。
-

Evaligo:您的一站式 AI 开发平台。构建、测试并监控生产级提示词,从而实现可靠 AI 功能的规模化部署。防止代价高昂的功能退化。
-

-

-

EasyLLM 是一个开源项目,提供了一些实用的工具和方法,用于处理大型语言模型(LLM),无论是开源的还是闭源的。立即开始或查看文档。
-

-

-

-

-

-

-

LiveBench 是一款 LLM 基准测试,每月从不同来源收集新的问题,并提供客观答案以进行准确评分。目前涵盖 6 个类别中的 18 个任务,并将不断增加更多任务。
-

Transformer Lab:一个开源平台,无需编码即可在本地构建、微调和运行大型语言模型 (LLM)。下载数百个模型,跨硬件微调,聊天,评估等等。
-

Deepchecks:LLM端到端评估平台。系统地测试、比较和监控您的AI应用,涵盖从开发到生产的全过程。减少模型幻觉,加速产品交付。
-

-

-

-

LlamaEdge 项目让您能够轻松运行 LLM 推理应用程序,并在本地为 Llama2 系列的 LLM 创建与 OpenAI 兼容的 API 服务。
-

-

-

-

LLaMA Factory 是一款开源的低代码大型模型微调框架,它集成了业界广泛使用的微调技术,并通过 Web UI 界面支持大型模型的零代码微调。
-

使用 LitServe 闪电般快速地部署 AI 模型! 轻松、可扩展地为 PyTorch、TensorFlow、JAX 等框架提供服务。 削减成本,专注于人工智能。 立即开始!
-

-

-

Lightly 是一款强大的机器学习数据整理工具套件。它能够筛选出有价值的数据,预训练模型,自动化数据处理流程并从中获得洞见。从而提升模型性能并降低成本。深受企业信赖。
-

-

-

LM Studio 是一款操作简便的桌面应用程序,专为探索本地和开源大型语言模型(LLM)而设计。LM Studio 跨平台桌面应用程序让您能够从 Hugging Face 下载并运行任何 ggml 兼容模型,并提供了一个简洁而功能强大的模型配置和推理用户界面(UI)。该应用程序在可能的情况下会充分利用您的图形处理器(GPU)。
