Huggingface's Open LLM Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | 2021-10 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Bootstrap,jQuery UI,jQuery,Popper.js,Nginx |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 0 |
| Country | United States |
| Month Visit | 2057 |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - 实时Klu.ai数据为该排行榜提供支持,用于评估LLM提供商,帮助您选择最适合您需求的API和模型。
Berkeley Function-Calling Leaderboard - 探索伯克利函数调用排行榜(也称为伯克利工具调用排行榜),了解大型语言模型 (LLM) 准确调用函数(又称工具)的能力。
LiveBench - LiveBench 是一款 LLM 基准测试,每月从不同来源收集新的问题,并提供客观答案以进行准确评分。目前涵盖 6 个类别中的 18 个任务,并将不断增加更多任务。
LightEval - LightEval 是一款轻量级的 LLM 评估套件,Hugging Face 一直在内部使用它,并与最近发布的 LLM 数据处理库 datatrove 和 LLM 训练库 nanotron 结合使用。