LiveBench
Berkeley Function-Calling Leaderboard| Launched | 2024-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Gzip,Progressive Web App,Varnish |
| Tag | Llm Benchmark Leaderboard |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | 111818 |
| Country | United States |
| Month Visit | 409857 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
AI2 WildBench Leaderboard - WildBench 是一個先進的基準測試工具,用於評估 LLM 在各種真實世界任務中的表現。對於那些希望提升 AI 效能並了解模型在實際情境中的局限性的人來說,它是必不可少的工具。
BenchLLM by V7 - BenchLLM:評估大型語言模型 (LLM) 回應,建立測試套件,自動化評估流程。透過全面的效能評估,提升 AI 系統效能。
ModelBench - 運用免程式碼大型語言模型評估,加速您的 AI 產品發佈。比較 180 多個模型、設計提示詞,並自信地進行測試。
Confident AI - 各類型公司都使用 Confident AI 來證明為何他們的 LLM 值得用於生產。
xbench - xbench:人工智慧基準評測,衡量其實用性與尖端能力。透過我們的雙軌系統,為您提供 AI 代理精準且動態的評估。