Huggingface's Open LLM Leaderboard
BenchLLM by V7| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | 2023-07 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Framer,Google Fonts,HSTS |
| Tag | Test Automation,Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 12812835 |
| Country | United States |
| Month Visit | 961 |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - Данная таблица лидеров для оценки поставщиков LLM работает на основе данных Klu.ai в режиме реального времени, что позволяет выбрать оптимальный API и модель для ваших нужд.
Berkeley Function-Calling Leaderboard - Изучите таблицу лидеров вызова функций Беркли (также известную как таблица лидеров вызова инструментов Беркли), чтобы увидеть, насколько хорошо большие языковые модели могут вызывать функции (также называемые инструментами) с точностью.
LiveBench - LiveBench – это бенчмарк для больших языковых моделей (LLM) с ежемесячными новыми вопросами из различных источников и объективными ответами для точного оценивания. В настоящее время представлено 18 задач в 6 категориях, и в будущем их станет еще больше.
LLM Explorer - С легкостью находите, сравнивайте и ранжируйте крупные языковые модели с помощью LLM Extractum. Упростите процесс выбора и стимулируйте инновации в приложениях ИИ.
LightEval - LightEval — это легкий набор инструментов для оценки больших языковых моделей (LLM), который Hugging Face использует внутри компании с недавно выпущенными библиотеками для обработки данных LLM datatrove и для обучения LLM nanotron.