Berkeley Function-Calling Leaderboard
Klu LLM Benchmarks| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | 2023-01 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Segment |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 295079 |
| Country | India |
| Month Visit | 129619 |
Estimated traffic data from Similarweb
Huggingface's Open LLM Leaderboard - Рейтинг открытых языковых моделей Huggingface направлен на поощрение открытого сотрудничества и прозрачности в оценке языковых моделей.
Scale Leaderboard - Рейтинг SEAL демонстрирует, что семейство больших языковых моделей (LLM) GPT от OpenAI занимает первое место в трех из четырех начальных областей, которые они используют для ранжирования моделей ИИ, а популярный Claude 3 Opus от Anthropic PBC занимает первое место в четвертой категории. Модели Gemini от Google LLC также показали хорошие результаты, разделив первое место с моделями GPT в паре областей.
LiveBench - LiveBench – это бенчмарк для больших языковых моделей (LLM) с ежемесячными новыми вопросами из различных источников и объективными ответами для точного оценивания. В настоящее время представлено 18 задач в 6 категориях, и в будущем их станет еще больше.
Hugging Face Agent Leaderboard - Выбирайте лучшего AI-агента, отвечающего вашим потребностям, с помощью Agent Leaderboard — объективного анализа производительности в реальных условиях, основанного на 14 критериях оценки.