Launched | 2023 |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Launched | |
Pricing Model | Free |
Starting Price | |
Tech used | |
Tag |
Global Rank | 0 |
Country | |
Month Visit | 0 |
Global Rank | |
Country | |
Month Visit |
Berkeley Function-Calling Leaderboard -
Berkeley 함수 호출 리더보드(Berkeley 툴 호출 리더보드라고도 함)를 탐색하여 LLM이 함수(또는 툴)를 정확하게 호출하는 능력을 확인해 보세요.
TruthfulQA - TruthfulQA를 사용하여 언어 모델의 진실성 측정하기. 이는 38개 범주에 걸친 817개 질문에 대한 벤치마크입니다. 오해에 따른 잘못된 답변은 피하십시오.
MMStar - 대규모 시각 언어 모델의 다중 모드 기능을 평가하기 위한 벤치마크 테스트 세트, MMStar. 모델 성능의 잠재적 문제점을 파악하고 MMStar를 사용하여 여러 과제에서 다중 모드 기능을 평가해 보세요. 지금 바로 사용해 보세요!
Lebesgue - Lebegues를 활용하여 마케팅 전략에 힘을 불어넣으세요. 이 AI 도구는 데이터를 분석하고, 권장 사항을 제공하며, 벤치마킹과 경쟁분석을 제공합니다. 지금 무료 평가판을 시작하세요!