ZeroBench| Launched | |
| Pricing Model | |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,JSDelivr,Font Awesome,GitHub Pages,Highlight.js,jQuery,Gzip,OpenGraph,Varnish,HSTS |
| Tag | Mlops,Data Science |
| Launched | 2024-10 |
| Pricing Model | Contact for Pricing |
| Starting Price | |
| Tech used | Next.js,Gzip,OpenGraph,Webpack |
| Tag | Llm Benchmark Leaderboard,Agent Development Frameworks,Data Insights |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
xbench - xbench:現実世界での実用性と、フロンティア領域の能力を追跡するAIベンチマーク。独自のデュアルトラックシステムにより、AIエージェントの正確かつ動的な評価を提供します。
LiveBench - LiveBench は、さまざまなソースからの毎月の新しい質問と正確な採点のための客観的な回答を備えた LLM ベンチマークであり、現在 6 つのカテゴリに 18 のタスクを備えており、さらに多くのタスクが追加される予定です。
AI2 WildBench Leaderboard - WildBenchは、現実世界のさまざまなタスクでLLMを評価する、高度なベンチマークツールです。AIのパフォーマンスを向上させ、実際のシナリオにおけるモデルの限界を理解したいと考えている人にとって不可欠です。
Web Bench - Web Benchは、多種多様な実稼働ウェブサイト全体にわたる複雑な現実世界タスクにおいて、AIウェブブラウジングエージェントの性能評価に特化して設計された、新しい、オープンかつ包括的なベンチマークデータセットです。