BenchLLM by V7
ModelBench| Launched | 2023-07 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Framer,Google Fonts,HSTS |
| Tag | Test Automation,Llm Benchmark Leaderboard |
| Launched | 2024-05 |
| Pricing Model | Free Trial |
| Starting Price | 49 $ Monthly |
| Tech used | Google Tag Manager,Amazon AWS CloudFront,Google Fonts |
| Tag | A/B Testing,Data Analysis,Data Visualization |
| Global Rank | 12812835 |
| Country | United States |
| Month Visit | 961 |
| Global Rank | 7783759 |
| Country | India |
| Month Visit | 1971 |
Estimated traffic data from Similarweb
LiveBench - LiveBench est un référentiel de LLM avec de nouvelles questions mensuelles provenant de sources diverses et des réponses objectives pour un scoring précis. Il comprend actuellement 18 tâches réparties en 6 catégories, et bien d'autres sont à venir.
AI2 WildBench Leaderboard - WildBench est un outil de benchmark avancé qui évalue les LLM sur un ensemble diversifié de tâches du monde réel. Il est essentiel pour ceux qui cherchent à améliorer les performances de l'IA et à comprendre les limites des modèles dans des scénarios pratiques.
Deepchecks - Deepchecks : La plateforme de bout en bout pour l'évaluation des LLM. Testez, comparez et supervisez systématiquement vos applications IA, du développement à la production. Réduisez les hallucinations et accélérez vos déploiements.
Confident AI - Les entreprises de toutes tailles utilisent Confident AI pour justifier la mise en production de leur LLM.