Berkeley Function-Calling Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | 2023-01 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Segment |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 295079 |
| Country | India |
| Month Visit | 129619 |
Estimated traffic data from Similarweb
Huggingface's Open LLM Leaderboard - Huggingface 的开放式大型语言模型排行榜旨在促进开放式协作和透明度,以评估语言模型。
Scale Leaderboard - SEAL 排行榜显示,OpenAI 的 GPT 系列大型语言模型 (LLM) 在其用于排名 AI 模型的四个初始领域中的三个领域中排名第一,而 Anthropic PBC 的流行 Claude 3 Opus 在第四个类别中排名第一。Google LLC 的 Gemini 模型也表现出色,在几个领域中与 GPT 模型并列第一。
LiveBench - LiveBench 是一款 LLM 基准测试,每月从不同来源收集新的问题,并提供客观答案以进行准确评分。目前涵盖 6 个类别中的 18 个任务,并将不断增加更多任务。
Hugging Face Agent Leaderboard - 借助 Agent Leaderboard,选择最适合您需求的 AI 智能体——它提供跨 14 项基准的公正、真实的性能洞察。