ZeroBench
Xbench| Launched | |
| Pricing Model | |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,JSDelivr,Font Awesome,GitHub Pages,Highlight.js,jQuery,Gzip,OpenGraph,Varnish,HSTS |
| Tag | Mlops,Data Science |
| Launched | 2025-05 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Business Intelligence,Data Science |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | 3631500 |
| Country | United States |
| Month Visit | 5816 |
Estimated traffic data from Similarweb
LiveBench - LiveBench는 다양한 출처에서 매달 새로운 질문을 제공하고 정확한 채점을 위한 객관적인 답변을 제공하는 LLM 벤치마크입니다. 현재 6가지 카테고리에 걸쳐 18개의 과제를 제공하며, 앞으로 더 많은 과제가 추가될 예정입니다.
AI2 WildBench Leaderboard - WildBench는 다양한 실제 작업 세트에서 LLM을 평가하는 고급 벤치마킹 도구입니다. 실제 시나리오에서 AI 성능을 향상시키고 모델의 한계를 이해하려는 사람들에게 필수적입니다.
BenchX - BenchX: AI 에이전트의 성능을 벤치마크하고 개선하세요. 의사 결정, 로그, 그리고 메트릭을 추적하고 CI/CD에 통합하여 실행 가능한 통찰력을 얻으세요.
Web Bench - Web Bench는 다양한 실제 웹사이트에서 마주하는 복잡하고 현실적인 과제에 대한 AI 웹 브라우징 에이전트의 성능을 평가하기 위해 특별히 고안된, 새롭고 개방적이며 포괄적인 벤치마크 데이터셋입니다.