Berkeley Function-Calling Leaderboard
Huggingface's Open LLM Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - リアルタイムのKlu.aiデータがこのリーダーボードを支え、LLMプロバイダーの評価を可能にし、ニーズに最適なAPIとモデルを選択できます。
Scale Leaderboard - SEAL Leaderboardによると、OpenAIのGPTファミリーのLLMは、AIモデルのランキングに使用されている最初の4つのドメインのうち3つで1位にランクインしています。Anthropic PBCのClaude 3 Opusは、4つ目のカテゴリで1位を獲得しました。Google LLCのGeminiモデルも好成績を収め、いくつかのドメインでGPTモデルと共同で1位にランクインしました。
LiveBench - LiveBench は、さまざまなソースからの毎月の新しい質問と正確な採点のための客観的な回答を備えた LLM ベンチマークであり、現在 6 つのカテゴリに 18 のタスクを備えており、さらに多くのタスクが追加される予定です。
Hugging Face Agent Leaderboard - 14種類のベンチマークに基づいた、偏りのないリアルな性能評価を提供する「Agent Leaderboard」で、ニーズに最適なAIエージェントを見つけましょう。