ModelBench| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | 2024-05 |
| Pricing Model | Free Trial |
| Starting Price | 49 $ Monthly |
| Tech used | Google Tag Manager,Amazon AWS CloudFront,Google Fonts |
| Tag | A/B Testing,Data Analysis,Data Visualization |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | 7783759 |
| Country | India |
| Month Visit | 1971 |
Estimated traffic data from Similarweb
LiveBench - LiveBench 是一款 LLM 基准测试,每月从不同来源收集新的问题,并提供客观答案以进行准确评分。目前涵盖 6 个类别中的 18 个任务,并将不断增加更多任务。
ZeroBench - ZeroBench:多模态模型的终极基准测试,包含 100 道具有挑战性的问题和 334 道子问题,旨在测试模型的视觉推理、准确性和计算能力。
AI2 WildBench Leaderboard - WildBench 是一款先进的基准测试工具,用于评估大型语言模型 (LLM) 在各种现实世界任务中的表现。对于那些希望提高 AI 性能并了解模型在实际场景中的局限性的用户来说,它至关重要。
The Pile - 探索 The Pile 的强大功能,这是一款由 EleutherAI 提供的 825 GiB 开源语言数据集。训练具有更广泛泛化能力的模型。