LiveBench
Berkeley Function-Calling Leaderboard| Launched | 2024-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Gzip,Progressive Web App,Varnish |
| Tag | Llm Benchmark Leaderboard |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Global Rank | 111818 |
| Country | United States |
| Month Visit | 409857 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
AI2 WildBench Leaderboard - WildBench는 다양한 실제 작업 세트에서 LLM을 평가하는 고급 벤치마킹 도구입니다. 실제 시나리오에서 AI 성능을 향상시키고 모델의 한계를 이해하려는 사람들에게 필수적입니다.
BenchLLM by V7 - BenchLLM: LLM 응답 평가, 테스트 세트 구축, 평가 자동화. 포괄적인 성능 평가를 통해 AI 기반 시스템을 향상시킵니다.
ModelBench - 노코드 LLM 평가로 AI 제품 출시 속도를 높이세요. 180개 이상의 모델을 비교하고, 프롬프트를 만들고, 자신 있게 테스트하세요.
Confident AI - 모든 규모의 회사가 Confident AI를 사용하여 자사의 LLM이 운영에 적합한 이유를 정당화하고 있습니다.
xbench - xbench: 실제 활용성과 최첨단 역량을 측정하는 AI 벤치마크. 당사의 듀얼 트랙 시스템으로 AI 에이전트의 정확하고 역동적인 평가를 제공합니다.