BenchX
Hugging Face Agent Leaderboard| Launched | 2024-10 |
| Pricing Model | Contact for Pricing |
| Starting Price | |
| Tech used | Next.js,Gzip,OpenGraph,Webpack |
| Tag | Llm Benchmark Leaderboard,Agent Development Frameworks,Data Insights |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
xbench - xbench: 실제 활용성과 최첨단 역량을 측정하는 AI 벤치마크. 당사의 듀얼 트랙 시스템으로 AI 에이전트의 정확하고 역동적인 평가를 제공합니다.
Web Bench - Web Bench는 다양한 실제 웹사이트에서 마주하는 복잡하고 현실적인 과제에 대한 AI 웹 브라우징 에이전트의 성능을 평가하기 위해 특별히 고안된, 새롭고 개방적이며 포괄적인 벤치마크 데이터셋입니다.
EvoAgentX - EvoAgentX: AI 에이전트 워크플로우를 자동화, 평가 및 발전시키세요. 복잡하고 자체 개선이 가능한 멀티 에이전트 시스템을 구축하는 개발자를 위한 오픈 소스 프레임워크입니다.
Future X - FutureX: LLM 에이전트가 현실 세계의 미래 사건을 얼마나 정확하게 예측하는지 실시간으로 평가합니다. 이를 통해 진정한 AI 지능에 대한 순수하고 편향 없는 통찰력을 확보하세요.