| Launched | 2023 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text Analysis |
| Launched | 2020-07 |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,Fastly,GitHub Pages,Varnish |
| Tag | Data Analysis,Data Science,Data Provider |
| Global Rank | 0 |
| Country | |
| Month Visit | 0 |
| Global Rank | 0 |
| Country | India |
| Month Visit | 4338 |
Estimated traffic data from Similarweb
LiveBench - LiveBench 是一個大型語言模型基準測試,每月從不同來源獲得新問題和客觀答案,以進行準確評分。目前包含 6 個類別的 18 個任務,並將陸續增加更多任務。
ZeroBench - ZeroBench:多模態模型的終極基準測試,透過 100 道具挑戰性的問題和 334 道子問題,檢驗視覺推理、準確性和運算能力。
AI2 WildBench Leaderboard - WildBench 是一個先進的基準測試工具,用於評估 LLM 在各種真實世界任務中的表現。對於那些希望提升 AI 效能並了解模型在實際情境中的局限性的人來說,它是必不可少的工具。
ModelBench - 運用免程式碼大型語言模型評估,加速您的 AI 產品發佈。比較 180 多個模型、設計提示詞,並自信地進行測試。