PolyLM

6 comments
PolyLM은 현재의 다국어 대규모 언어 모델의 한계와 격차를 해소하기 위해 고안된 다국어 대규모 언어 모델입니다.0
웹사이트 방문하기

What is PolyLM?

PolyLM은 다국어 대규모 언어 모델로, 현재 LLM 연구의 빈칸과 한계를 해결하고 이 분야를 발전시키기 위해 포괄적이고 혁신적인 솔루션을 제공합니다.

PolyLM은 세계적으로 가장 많이 사용되는 18개 언어를 포함합니다. 스페인어, 러시아어, 아랍어, 일본어, 한국어, 태국어, 인도네시아어, 중국어 등 주요 비영어 언어에 능통합니다. 다음을 포함한 기존 오픈소스 모델을 완벽하게 보완합니다. (1) LLaMA는 전체 데이터 세트에서 영어가 우세합니다. (2) BLOOM은 일본어, 한국어, 태국어 등 상당한 인구가 사용하는 언어를 다루지 못합니다.

더 나은 다국어 지시 따르기 기능. ALPACA와 CHINESEALPACA를 보완하는 MULTIALPACA를 제안하여, 특히 영어가 모국어가 아닌 사용자의 지시를 LLM이 더 잘 따를 수 있도록 합니다.

강력한 성능. 유사한 모델 규모의 인기 있는 다국어 LLM과 비교했을 때 PolyLM은 QA, 이해, 생성을 포함한 다양한 태스크에서 놀라운 성능을 보여줍니다.


More information on PolyLM

Launched
2023
Pricing Model
Free
Starting Price
Global Rank
Country
Month Visit
<5k
Tech used
PolyLM was manually vetted by our editorial team and was first featured on September 4th 2024.
Aitoolnet Featured banner

PolyLM 대체품

더보기 대체품
  1. 언어 모델을 강화하고, 성능을 향상시키고, 정확한 결과를 얻으세요. WizardLM은 코딩, 수학, NLP 태스크에 최적의 툴입니다.

  2. 대규모 언어 모델에 대한 처리량이 높고 메모리 효율적인 추론 및 서비스 엔진

  3. MiniCPM은 ModelBest Inc.와 TsinghuaNLP에서 개발한 End-Side LLM으로, 임베딩을 제외하고 24억 개의 파라미터만 있고(총 27억 개)

  4. PaLM 2를 만나보세요. 추론, 번역 및 코딩 작업을 위한 Google의 첨단 언어 모델입니다. 책임 있는 AI 관행을 바탕으로 구축된 PaLM 2는 다국어 협업과 전문화된 코드 생성에서 탁월합니다.

  5. GLM-130B: 개방형 2개 국어 사전 학습 모델(ICLR 2023)