Hugging Face Agent Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Future AGI - 饱受不可靠的生成式AI困扰? Future AGI是集评估、优化与实时安全于一体的端到端平台。 助您加速构建可信AI。
BenchX - BenchX:用于评估和提升 AI 智能体的性能。跟踪决策过程、日志和各项指标,并可集成到 CI/CD 流程中,助您获得可执行的洞察分析。
xbench - xbench: 追踪人工智能在现实世界中的实际效用与前沿能力的基准测试。借助我们独有的双轨系统,为AI智能体提供精准、动态的评估。
LiveBench - LiveBench 是一款 LLM 基准测试,每月从不同来源收集新的问题,并提供客观答案以进行准确评分。目前涵盖 6 个类别中的 18 个任务,并将不断增加更多任务。