AI2 WildBench Leaderboard
Web Bench| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Launched | 2025-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Cloudflare CDN,Gzip,OpenGraph |
| Tag | Web Analytics |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | United States |
| Month Visit | 723 |
Estimated traffic data from Similarweb
LiveBench - LiveBench 是一個大型語言模型基準測試,每月從不同來源獲得新問題和客觀答案,以進行準確評分。目前包含 6 個類別的 18 個任務,並將陸續增加更多任務。
ModelBench - 運用免程式碼大型語言模型評估,加速您的 AI 產品發佈。比較 180 多個模型、設計提示詞,並自信地進行測試。
BenchLLM by V7 - BenchLLM:評估大型語言模型 (LLM) 回應,建立測試套件,自動化評估流程。透過全面的效能評估,提升 AI 系統效能。
xbench - xbench:人工智慧基準評測,衡量其實用性與尖端能力。透過我們的雙軌系統,為您提供 AI 代理精準且動態的評估。