Launched | 2023 |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Launched | |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Global Rank | 0 |
Country | |
Month Visit | 0 |
Global Rank | |
Country | |
Month Visit |
Berkeley Function-Calling Leaderboard - 探索伯克利函数调用排行榜(也称为伯克利工具调用排行榜),了解大型语言模型 (LLM) 准确调用函数(又称工具)的能力。
TruthfulQA - 使用 TruthfulQA 衡量语言模型的真实性,该基准包含 38 个类别的 817 个问题。避免基于误解的错误答案。
MMStar - MMStar,用于评估视觉语言模型大规模多模态功能的基准测试集。使用 MMStar,探索模型性能中的潜在问题,并跨多个任务评估其多模态能力。立即尝试!
Lebesgue - 借助 Lebesgue,您可以对您的营销策略进行全面升级,该 AI 工具能够分析数据、提供建议,并提供基准测试和竞争分析。立即开始您的免费试用吧!