Berkeley Function-Calling Leaderboard
AI2 WildBench Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - Les données de Klu.ai en temps réel alimentent ce classement pour évaluer les fournisseurs de LLM, permettant la sélection de l'API et du modèle optimaux pour vos besoins.
Huggingface's Open LLM Leaderboard - Le classement Open LLM Leaderboard de Huggingface vise à promouvoir une collaboration ouverte et la transparence dans l'évaluation des modèles de langage.
Scale Leaderboard - Le classement SEAL montre que la famille GPT d'OpenAI occupe la première place dans trois des quatre domaines initiaux utilisés pour classer les modèles d'IA, Claude 3 Opus d'Anthropic PBC s'emparant de la première place dans la quatrième catégorie. Les modèles Gemini de Google LLC ont également bien performé, se classant en tête à égalité avec les modèles GPT dans quelques-uns des domaines.
LiveBench - LiveBench est un référentiel de LLM avec de nouvelles questions mensuelles provenant de sources diverses et des réponses objectives pour un scoring précis. Il comprend actuellement 18 tâches réparties en 6 catégories, et bien d'autres sont à venir.
Hugging Face Agent Leaderboard - Choisissez l'agent d'IA le plus adapté à vos besoins grâce au Agent Leaderboard : des données de performance impartiales et concrètes, basées sur 14 benchmarks.