Launched | 2023 |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Launched | |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Global Rank | 0 |
Country | |
Month Visit | 0 |
Global Rank | |
Country | |
Month Visit |
Berkeley Function-Calling Leaderboard -
Berkeley Function Calling Leaderboard(別名 Berkeley Tool Calling Leaderboard)で、LLM の関数(別名ツール)を正確に呼び出す能力をご確認ください。
TruthfulQA - TruthfulQA を使用して言語モデルの真実性を測定します。これは、38 のカテゴリ全体で 817 の質問からなるベンチマークです。誤解に基づく誤った回答を避けてください。
MMStar - MMStarは、ビジュアル言語モデルの大規模マルチモーダル機能を評価するためのベンチマークテストセットです。MMStarを使用すると、モデルのパフォーマンスにおける潜在的な問題を発見し、マルチモーダル能力を複数のタスクで評価できます。今すぐ試してみましょう!
Lebesgue - AIツールであるLebesgueでマーケティング戦略を強化しましょう。データ分析、推奨事項の提供、ベンチマークおよび競合分析を行います。今すぐ無料トライアルを開始しましょう!