ZeroBench
BenchX| Launched | |
| Pricing Model | |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,JSDelivr,Font Awesome,GitHub Pages,Highlight.js,jQuery,Gzip,OpenGraph,Varnish,HSTS |
| Tag | Mlops,Data Science |
| Launched | 2024-10 |
| Pricing Model | Contact for Pricing |
| Starting Price | |
| Tech used | Next.js,Gzip,OpenGraph,Webpack |
| Tag | Llm Benchmark Leaderboard,Agent Development Frameworks,Data Insights |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
xbench - xbench: 실제 활용성과 최첨단 역량을 측정하는 AI 벤치마크. 당사의 듀얼 트랙 시스템으로 AI 에이전트의 정확하고 역동적인 평가를 제공합니다.
LiveBench - LiveBench는 다양한 출처에서 매달 새로운 질문을 제공하고 정확한 채점을 위한 객관적인 답변을 제공하는 LLM 벤치마크입니다. 현재 6가지 카테고리에 걸쳐 18개의 과제를 제공하며, 앞으로 더 많은 과제가 추가될 예정입니다.
AI2 WildBench Leaderboard - WildBench는 다양한 실제 작업 세트에서 LLM을 평가하는 고급 벤치마킹 도구입니다. 실제 시나리오에서 AI 성능을 향상시키고 모델의 한계를 이해하려는 사람들에게 필수적입니다.
Web Bench - Web Bench는 다양한 실제 웹사이트에서 마주하는 복잡하고 현실적인 과제에 대한 AI 웹 브라우징 에이전트의 성능을 평가하기 위해 특별히 고안된, 새롭고 개방적이며 포괄적인 벤치마크 데이터셋입니다.