Belebele
Berkeley Function-Calling Leaderboard| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
LiveBench - LiveBench es un punto de referencia para LLM con nuevas preguntas mensuales de diversas fuentes y respuestas objetivas para una puntuación precisa, actualmente con 18 tareas en 6 categorías y más por venir.
ZeroBench - ZeroBench: El punto de referencia definitivo para modelos multimodales, que pone a prueba el razonamiento visual, la precisión y las habilidades computacionales con 100 preguntas desafiantes y 334 subpreguntas.
AI2 WildBench Leaderboard - WildBench es una herramienta de evaluación avanzada que evalúa los LLM en un conjunto diverso de tareas del mundo real. Es esencial para aquellos que buscan mejorar el rendimiento de la IA y comprender las limitaciones del modelo en escenarios prácticos.
The Pile - Descubre el poder de The Pile, un conjunto de datos idiomáticos de código abierto de 825 GiB de EleutherAI. Entrena modelos con capacidades de generalización más amplias.
ModelBench - Lanza productos de IA más rápido con evaluaciones LLM sin código. Compara más de 180 modelos, crea prompts y prueba con confianza.