AI2 WildBench Leaderboard| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
LiveBench - LiveBench は、さまざまなソースからの毎月の新しい質問と正確な採点のための客観的な回答を備えた LLM ベンチマークであり、現在 6 つのカテゴリに 18 のタスクを備えており、さらに多くのタスクが追加される予定です。
ZeroBench - ZeroBench:マルチモーダルモデルの究極のベンチマーク。視覚的推論、精度、計算能力を、100個の難解な質問と334個のサブ質問で検証します。
The Pile - EleutherAI による 825 GiB のオープンソース言語データセットである The Pile の威力を発見しましょう。より広範な一般化能力を持つモデルを訓練します。
ModelBench - ノーコードのLLM評価で、AI製品をより迅速にローンチしましょう。180種類以上のモデルを比較し、プロンプトを作成し、自信を持ってテストできます。