Berkeley Function-Calling Leaderboard
Hugging Face Agent Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - Les données de Klu.ai en temps réel alimentent ce classement pour évaluer les fournisseurs de LLM, permettant la sélection de l'API et du modèle optimaux pour vos besoins.
Huggingface's Open LLM Leaderboard - Le classement Open LLM Leaderboard de Huggingface vise à promouvoir une collaboration ouverte et la transparence dans l'évaluation des modèles de langage.
Scale Leaderboard - Le classement SEAL montre que la famille GPT d'OpenAI occupe la première place dans trois des quatre domaines initiaux utilisés pour classer les modèles d'IA, Claude 3 Opus d'Anthropic PBC s'emparant de la première place dans la quatrième catégorie. Les modèles Gemini de Google LLC ont également bien performé, se classant en tête à égalité avec les modèles GPT dans quelques-uns des domaines.
LiveBench - LiveBench est un référentiel de LLM avec de nouvelles questions mensuelles provenant de sources diverses et des réponses objectives pour un scoring précis. Il comprend actuellement 18 tâches réparties en 6 catégories, et bien d'autres sont à venir.