Huggingface's Open LLM Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis |
| Launched | 2021-10 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Bootstrap,jQuery UI,jQuery,Popper.js,Nginx |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 0 |
| Country | United States |
| Month Visit | 2057 |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - 即時的 Klu.ai 資料為此排行榜提供動力,用於評估 LLM 供應商,讓您能夠根據自身需求選擇最佳的 API 和模型。
Berkeley Function-Calling Leaderboard - 探索柏克萊函數呼叫排行榜(也稱為柏克萊工具呼叫排行榜),了解大型語言模型 (LLM) 準確呼叫函數(又稱工具)的能力。
LiveBench - LiveBench 是一個大型語言模型基準測試,每月從不同來源獲得新問題和客觀答案,以進行準確評分。目前包含 6 個類別的 18 個任務,並將陸續增加更多任務。
LightEval - LightEval 是一個輕量級的 LLM 評估套件,Hugging Face 在內部一直使用它,搭配最近發佈的 LLM 資料處理函式庫 datatrove 和 LLM 訓練函式庫 nanotron。