AI2 WildBench Leaderboard
BenchLLM by V7| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Launched | 2023-07 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Framer,Google Fonts,HSTS |
| Tag | Test Automation,Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 12812835 |
| Country | United States |
| Month Visit | 961 |
Estimated traffic data from Similarweb
LiveBench - LiveBench est un référentiel de LLM avec de nouvelles questions mensuelles provenant de sources diverses et des réponses objectives pour un scoring précis. Il comprend actuellement 18 tâches réparties en 6 catégories, et bien d'autres sont à venir.
ModelBench - Lancez plus rapidement vos produits d'IA grâce aux évaluations LLM sans code. Comparez plus de 180 modèles, concevez des invites et testez en toute confiance.
Web Bench - Web Bench est un ensemble de données de référence inédit, ouvert et exhaustif, spécialement conçu pour évaluer les performances des agents IA de navigation web sur des tâches complexes et réelles, à travers un large éventail de sites web actifs.
xbench - xbench : Le benchmark IA qui mesure l'utilité concrète et les capacités de pointe. Bénéficiez d'une évaluation précise et dynamique des agents d'IA grâce à notre système à double approche.