ZeroBench
LiveBench| Launched | |
| Pricing Model | |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,JSDelivr,Font Awesome,GitHub Pages,Highlight.js,jQuery,Gzip,OpenGraph,Varnish,HSTS |
| Tag | Mlops,Data Science |
| Launched | 2024-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Gzip,Progressive Web App,Varnish |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 111818 |
| Country | United States |
| Month Visit | 409857 |
Estimated traffic data from Similarweb
xbench - xbench : Le benchmark IA qui mesure l'utilité concrète et les capacités de pointe. Bénéficiez d'une évaluation précise et dynamique des agents d'IA grâce à notre système à double approche.
AI2 WildBench Leaderboard - WildBench est un outil de benchmark avancé qui évalue les LLM sur un ensemble diversifié de tâches du monde réel. Il est essentiel pour ceux qui cherchent à améliorer les performances de l'IA et à comprendre les limites des modèles dans des scénarios pratiques.
BenchX - BenchX : Évaluez et améliorez les agents d'IA. Suivez les décisions, les logs et les métriques. Intégrez BenchX à l'intégration continue et à la livraison continue (CI/CD). Obtenez des informations exploitables.
Web Bench - Web Bench est un ensemble de données de référence inédit, ouvert et exhaustif, spécialement conçu pour évaluer les performances des agents IA de navigation web sur des tâches complexes et réelles, à travers un large éventail de sites web actifs.