Berkeley Function-Calling Leaderboard
Hugging Face Agent Leaderboard| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | Google Analytics,Google Tag Manager,cdnjs,Fastly,Google Fonts,Bootstrap,GitHub Pages,Gzip,Varnish,YouTube |
| Tag | Llm Benchmark Leaderboard,Data Analysis,Data Visualization |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Llm Benchmark Leaderboard |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Klu LLM Benchmarks - 실시간 Klu.ai 데이터는 LLM 제공업체를 평가하기 위한 이 리더보드를 구동하여 사용자의 요구에 맞는 최적의 API 및 모델을 선택할 수 있도록 지원합니다.
Huggingface's Open LLM Leaderboard - Huggingface의 Open LLM Leaderboard는 언어 모델 평가에 대한 개방적인 협업과 투명성을 촉진하기 위한 목표를 가지고 있습니다.
Scale Leaderboard - SEAL 리더보드에 따르면 OpenAI의 GPT 계열 LLM은 AI 모델을 평가하는 데 사용되는 초기 4개 도메인 중 3개에서 1위를 차지했습니다. Anthropic PBC의 인기 모델인 Claude 3 Opus는 나머지 하나의 카테고리에서 1위를 차지했습니다. Google LLC의 Gemini 모델도 좋은 성적을 거두어 몇몇 도메인에서 GPT 모델과 공동 1위를 차지했습니다.
LiveBench - LiveBench는 다양한 출처에서 매달 새로운 질문을 제공하고 정확한 채점을 위한 객관적인 답변을 제공하는 LLM 벤치마크입니다. 현재 6가지 카테고리에 걸쳐 18개의 과제를 제공하며, 앞으로 더 많은 과제가 추가될 예정입니다.