Huggingface's Open LLM Leaderboard
Klu LLM Benchmarks| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | 2023-01 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Segment |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 295079 |
| Country | India |
| Month Visit | 129619 |
Estimated traffic data from Similarweb
Berkeley Function-Calling Leaderboard - Изучите таблицу лидеров вызова функций Беркли (также известную как таблица лидеров вызова инструментов Беркли), чтобы увидеть, насколько хорошо большие языковые модели могут вызывать функции (также называемые инструментами) с точностью.
LiveBench - LiveBench – это бенчмарк для больших языковых моделей (LLM) с ежемесячными новыми вопросами из различных источников и объективными ответами для точного оценивания. В настоящее время представлено 18 задач в 6 категориях, и в будущем их станет еще больше.
LLM Explorer - С легкостью находите, сравнивайте и ранжируйте крупные языковые модели с помощью LLM Extractum. Упростите процесс выбора и стимулируйте инновации в приложениях ИИ.
LightEval - LightEval — это легкий набор инструментов для оценки больших языковых моделей (LLM), который Hugging Face использует внутри компании с недавно выпущенными библиотеками для обработки данных LLM datatrove и для обучения LLM nanotron.