Huggingface's Open LLM Leaderboard
LLM Explorer| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | 2021-10 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Bootstrap,jQuery UI,jQuery,Popper.js,Nginx |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 0 |
| Country | United States |
| Month Visit | 2057 |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - Данная таблица лидеров для оценки поставщиков LLM работает на основе данных Klu.ai в режиме реального времени, что позволяет выбрать оптимальный API и модель для ваших нужд.
Berkeley Function-Calling Leaderboard - Изучите таблицу лидеров вызова функций Беркли (также известную как таблица лидеров вызова инструментов Беркли), чтобы увидеть, насколько хорошо большие языковые модели могут вызывать функции (также называемые инструментами) с точностью.
LiveBench - LiveBench – это бенчмарк для больших языковых моделей (LLM) с ежемесячными новыми вопросами из различных источников и объективными ответами для точного оценивания. В настоящее время представлено 18 задач в 6 категориях, и в будущем их станет еще больше.
LightEval - LightEval — это легкий набор инструментов для оценки больших языковых моделей (LLM), который Hugging Face использует внутри компании с недавно выпущенными библиотеками для обработки данных LLM datatrove и для обучения LLM nanotron.