AI2 WildBench Leaderboard| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard,Data Analysis,A/B Testing |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
LiveBench - LiveBench는 다양한 출처에서 매달 새로운 질문을 제공하고 정확한 채점을 위한 객관적인 답변을 제공하는 LLM 벤치마크입니다. 현재 6가지 카테고리에 걸쳐 18개의 과제를 제공하며, 앞으로 더 많은 과제가 추가될 예정입니다.
ZeroBench - ZeroBench: 멀티모달 모델을 위한 궁극적인 벤치마크로서, 시각적 추론, 정확성, 그리고 연산 능력을 시험하는 100개의 도전적인 질문과 334개의 하위 질문으로 구성되어 있습니다.
The Pile - EleutherAI에서 만든 825 GiB 오픈 소스 언어 데이터셋인 The Pile의 힘을 확인해보세요. 보다 폭넓은 일반화 능력으로 모델을 훈련하세요.
ModelBench - 노코드 LLM 평가로 AI 제품 출시 속도를 높이세요. 180개 이상의 모델을 비교하고, 프롬프트를 만들고, 자신 있게 테스트하세요.