Huggingface's Open LLM Leaderboard
Berkeley Function-Calling Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - リアルタイムのKlu.aiデータがこのリーダーボードを支え、LLMプロバイダーの評価を可能にし、ニーズに最適なAPIとモデルを選択できます。
LiveBench - LiveBench は、さまざまなソースからの毎月の新しい質問と正確な採点のための客観的な回答を備えた LLM ベンチマークであり、現在 6 つのカテゴリに 18 のタスクを備えており、さらに多くのタスクが追加される予定です。
LLM Explorer - 大規模言語モデルを簡単に発見、比較、ランク付けできるLLM Extractumを活用しましょう。選択プロセスを単純化し、AIアプリケーションのイノベーションを促進します。
LightEval - LightEvalは、Hugging Faceが最近リリースしたLLMデータ処理ライブラリdatatroveとLLMトレーニングライブラリnanotronで社内で使用している、軽量なLLM評価スイートです。