PolyLM

6 comments
PolyLM es un modelo de lenguaje grande y multilingüe diseñado para abordar las brechas y limitaciones en el conocimiento actual...0
Visitar sitio web

What is PolyLM?

PolyLM es un modelo de lenguaje grande políglota, cuyo objetivo es abordar las siguientes deficiencias y limitaciones en la investigación actual de LLM, ofreciendo una solución completa e innovadora para avanzar en este campo.

PolyLM, que abarca 18 de los idiomas más hablados, es competente en los principales idiomas no ingleses que se hablan en todo el mundo, como el español, el ruso, el árabe, el japonés, el coreano, el tailandés, el indonesio y el chino, etc. Es un complemento perfecto para los modelos de código abierto existentes, incluidos: (1) LLaMA, en el que el inglés predomina en todo el conjunto de datos. (2) BLOOM, no aborda idiomas hablados por poblaciones significativas, como el japonés, el coreano y el tailandés.

Mejor capacidad para seguir instrucciones multilingües. Proponemos MULTIALPACA para complementar ALPACA y CHINESEALPACA, haciendo que los LLM sigan mejor las instrucciones multilingües, particularmente las provenientes de hablantes no nativos de inglés.

Sólido rendimiento. En comparación con los LLM multilingües populares de tamaño de modelo similar, PolyLM demuestra un rendimiento notable en diversas tareas, incluidas preguntas y respuestas, comprensión y generación.


More information on PolyLM

Launched
2023
Pricing Model
Free
Starting Price
Global Rank
Country
Month Visit
<5k
Tech used
PolyLM was manually vetted by our editorial team and was first featured on September 4th 2024.
Aitoolnet Featured banner

PolyLM Alternativas

Más Alternativas
  1. Mejora los modelos de lenguaje, mejora el rendimiento y obtiene resultados precisos. WizardLM es la herramienta definitiva para tareas de codificación, matemáticas y PNL.

  2. Un motor de inferencia y servicio de alto rendimiento y bajo consumo de memoria para LLM

  3. MiniCPM es un LLM de fin lateral desarrollado por ModelBest Inc. y TsinghuaNLP, con solo 2.4B parámetros excluyendo incrustaciones (2.7B en total).

  4. Descubre PaLM 2, el modelo avanzado de lenguaje de Google para tareas de razonamiento, traducción y codificación. Desarrollado con prácticas responsables de IA, PaLM 2 destaca en la colaboración multilingüe y la generación de código especializado.

  5. GLM-130B: un modelo preentrenado bilingüe abierto (ICLR 2023)