Berkeley Function-Calling Leaderboard
Huggingface's Open LLM Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - Los datos de Klu.ai en tiempo real impulsan esta tabla de clasificación para evaluar proveedores de LLM, permitiendo la selección de la API y el modelo óptimos para sus necesidades.
Scale Leaderboard - Las tablas de clasificación de SEAL muestran que la familia GPT de LLMs de OpenAI ocupa el primer lugar en tres de los cuatro dominios iniciales que utiliza para clasificar los modelos de IA, mientras que Claude 3 Opus, el popular modelo de Anthropic PBC, se lleva el primer lugar en la cuarta categoría. Los modelos Gemini de Google LLC también se desempeñaron bien, ocupando el primer lugar junto con los modelos GPT en un par de los dominios.
LiveBench - LiveBench es un punto de referencia para LLM con nuevas preguntas mensuales de diversas fuentes y respuestas objetivas para una puntuación precisa, actualmente con 18 tareas en 6 categorías y más por venir.
Hugging Face Agent Leaderboard - Seleccione el mejor agente de IA para sus necesidades con la Agent Leaderboard: análisis de rendimiento imparciales y del mundo real en 14 pruebas de referencia.