AI2 WildBench Leaderboard
ModelBench| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Launched | 2024-05 |
| Pricing Model | Free Trial |
| Starting Price | 49 $ Monthly |
| Tech used | Google Tag Manager,Amazon AWS CloudFront,Google Fonts |
| Tag | A/B Testing,Data Analysis,Data Visualization |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 7783759 |
| Country | India |
| Month Visit | 1971 |
Estimated traffic data from Similarweb
LiveBench - LiveBench – это бенчмарк для больших языковых моделей (LLM) с ежемесячными новыми вопросами из различных источников и объективными ответами для точного оценивания. В настоящее время представлено 18 задач в 6 категориях, и в будущем их станет еще больше.
BenchLLM by V7 - BenchLLM: Оценивайте ответы больших языковых моделей, создавайте наборы тестов, автоматизируйте оценку. Повышайте качество систем на основе ИИ с помощью всесторонней оценки производительности.
Web Bench - Web Bench представляет собой новый, открытый и всеобъемлющий набор данных для бенчмаркинга, специально разработанный для оценки производительности веб-агентов на основе ИИ в решении сложных, реальных задач на широком спектре действующих веб-сайтов.
xbench - xbench: Бенчмарк ИИ, оценивающий реальную полезность и передовые возможности. Получите точную, динамичную оценку ИИ-агентов с помощью нашей двухканальной системы.