Belebele
Berkeley Function-Calling Leaderboard| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
LiveBench - LiveBench est un référentiel de LLM avec de nouvelles questions mensuelles provenant de sources diverses et des réponses objectives pour un scoring précis. Il comprend actuellement 18 tâches réparties en 6 catégories, et bien d'autres sont à venir.
ZeroBench - ZeroBench : Le banc d'essai ultime pour les modèles multimodaux, évaluant le raisonnement visuel, la précision et les compétences computationnelles à travers 100 questions complexes et 334 sous-questions.
AI2 WildBench Leaderboard - WildBench est un outil de benchmark avancé qui évalue les LLM sur un ensemble diversifié de tâches du monde réel. Il est essentiel pour ceux qui cherchent à améliorer les performances de l'IA et à comprendre les limites des modèles dans des scénarios pratiques.
The Pile - Découvrez la puissance de The Pile, un ensemble de données linguistiques open source de 825 Gio par EleutherAI. Entraînez des modèles avec des capacités de généralisation plus larges.
ModelBench - Lancez plus rapidement vos produits d'IA grâce aux évaluations LLM sans code. Comparez plus de 180 modèles, concevez des invites et testez en toute confiance.