LiveBench
Xbench| Launched | 2024-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Gzip,Progressive Web App,Varnish |
| Tag | Llm Benchmark Leaderboard |
| Launched | 2025-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Business Intelligence,Data Science |
| Global Rank | 111818 |
| Country | United States |
| Month Visit | 409857 |
| Global Rank | 3631500 |
| Country | United States |
| Month Visit | 5816 |
Estimated traffic data from Similarweb
AI2 WildBench Leaderboard - WildBench - это передовой инструмент для бенчмаркинга, который оценивает большие языковые модели (LLM) на разнообразном наборе реальных задач. Он незаменим для тех, кто стремится повысить производительность ИИ и понять ограничения модели в практических сценариях.
BenchLLM by V7 - BenchLLM: Оценивайте ответы больших языковых моделей, создавайте наборы тестов, автоматизируйте оценку. Повышайте качество систем на основе ИИ с помощью всесторонней оценки производительности.
ModelBench - Запускайте продукты на основе ИИ быстрее с помощью бескликовой оценки больших языковых моделей. Сравнивайте более 180 моделей, создавайте запросы и тестируйте с уверенностью.
Confident AI - Компании всех размеров используют Confident AI, чтобы обосновать, почему их LLM заслуживают места в процессе производства.