ZeroBench
LiveBench| Launched | |
| Pricing Model | |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,JSDelivr,Font Awesome,GitHub Pages,Highlight.js,jQuery,Gzip,OpenGraph,Varnish,HSTS |
| Tag | Mlops,Data Science |
| Launched | 2024-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Gzip,Progressive Web App,Varnish |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 111818 |
| Country | United States |
| Month Visit | 409857 |
Estimated traffic data from Similarweb
xbench - xbench: El referente de IA que mide la utilidad en entornos reales y las capacidades de vanguardia. Obtenga una evaluación precisa y dinámica de los agentes de IA con nuestro sistema de doble vía.
AI2 WildBench Leaderboard - WildBench es una herramienta de evaluación avanzada que evalúa los LLM en un conjunto diverso de tareas del mundo real. Es esencial para aquellos que buscan mejorar el rendimiento de la IA y comprender las limitaciones del modelo en escenarios prácticos.
BenchX - BenchX: Evalúa y mejora agentes de IA. Realiza un seguimiento de las decisiones, los registros y las métricas. Intégralo en CI/CD. Obtén información práctica y útil.
Web Bench - Web Bench es un conjunto de datos de evaluación comparativa (benchmark) novedoso, abierto e integral, diseñado específicamente para evaluar el rendimiento de los agentes de IA de navegación web en tareas complejas y del mundo real, que abarcan una amplia diversidad de sitios web activos.