Las mejores MiniCPM-2B alternativas en 2025
-

Con un total de 8 mil millones de parámetros, el modelo supera a modelos propietarios como GPT-4V-1106, Gemini Pro, Qwen-VL-Max y Claude 3 en rendimiento general.
-

MiniCPM3-4B es la tercera generación de la serie MiniCPM. El rendimiento general de MiniCPM3-4B supera a Phi-3.5-mini-Instruct y GPT-3.5-Turbo-0125, siendo comparable con muchos modelos recientes de 7B~9B.
-

SmolLM es una serie de modelos de lenguaje pequeños de última generación disponibles en tres tamaños: 135M, 360M y 1.7B parámetros.
-

¡Crea modelos de IA desde cero! MiniMind ofrece un entrenamiento rápido y asequible de LLM en una sola GPU. Aprende PyTorch y crea tu propia IA.
-

OpenBMB: Creación de un centro de modelos de lenguaje preentrenados a gran escala y herramientas para acelerar la formación, el ajuste y la inferencia de modelos grandes con más de 10 mil millones de parámetros. Únete a nuestra comunidad de código abierto y haz que los modelos grandes lleguen a todos.
-

GLM-130B: un modelo preentrenado bilingüe abierto (ICLR 2023)
-

PolyLM, un revolucionario modelo lingüístico poliglota (LLM), admite 18 idiomas, sobresale en diversas tareas y es de código abierto. Ideal para desarrolladores, investigadores y empresas con necesidades multilingües.
-

JetMoE-8B se entrenó con un costo de menos de $ 0,1 millones, pero supera a LLaMA2-7B de Meta AI, que cuenta con recursos de capacitación multimillonarios. La capacitación de LLM puede ser mucho más económica de lo que generalmente se cree.
-

Yuan2.0-M32 es un modelo de lenguaje de Mezcla de Expertos (MoE) con 32 expertos, de los cuales 2 están activos.
-

MiniMax-M1: Modelo de IA de pesos abiertos, con un contexto de 1 millón de tokens y una profunda capacidad de razonamiento. Procesa eficientemente grandes volúmenes de datos para aplicaciones avanzadas de inteligencia artificial.
-

¡Explora InternLM2, una herramienta de IA con modelos abiertos! Destaca en tareas de contexto extenso, razonamiento, matemáticas, interpretación de código y redacción creativa. Descubre sus aplicaciones versátiles y sus sólidas capacidades de utilización de herramientas para la investigación, el desarrollo de aplicaciones y las interacciones de chat. Mejora tu panorama de IA con InternLM2.
-

Descubre PaLM 2, el modelo avanzado de lenguaje de Google para tareas de razonamiento, traducción y codificación. Desarrollado con prácticas responsables de IA, PaLM 2 destaca en la colaboración multilingüe y la generación de código especializado.
-

¡OLMo 2 32B: El LLM de código abierto que desafía a GPT-3.5! Código, datos y pesos gratuitos. Investiga, personaliza y crea una IA más inteligente.
-

Para acelerar la inferencia de los LLM y mejorar la percepción de los LLM de información clave, comprime el indicador y KV-Cache, que logra una compresión de hasta 20 veces con una pérdida de rendimiento mínima.
-

Los modelos de lenguaje de la serie Qwen2.5 ofrecen capacidades mejoradas con conjuntos de datos más grandes, más conocimiento, mejores habilidades de codificación y matemáticas, y una alineación más cercana a las preferencias humanas. De código abierto y disponible a través de API.
-

El proyecto TinyLlama es una iniciativa abierta para preentrenar un modelo Llama de 1.1B en 3 billones de tokens.
-

iconiconRaperoarrow56/5000iconMiniMax es la última generación de modelos de lenguaje chino a gran escala, y su objetivo principal es ayudar a los humanos a escribir de manera eficiente, estimular la creatividad, adquirir conocimientos y tomar decisiones.
-

Descubre StableLM, un modelo de lenguaje de código abierto de Stability AI. Genera texto y código de alto rendimiento en dispositivos personales con modelos pequeños y eficientes. Tecnología de IA transparente, accesible y de apoyo para desarrolladores e investigadores.
-

Un motor de inferencia y servicio de alto rendimiento y bajo consumo de memoria para LLM
-

CentML agiliza la implementación de LLM, reduce costos hasta en un 65% y garantiza un rendimiento óptimo. Ideal para empresas y startups. ¡Pruébalo ahora!
-

Mini-Gemini es compatible con una serie de modelos de lenguaje grandes densos y MoE (LLM, por sus siglas en inglés) de 2B a 34B con generación, razonamiento y comprensión de imágenes de forma simultánea. Creamos este repositorio basándonos en LLaVA.
-

Una familia de modelos de lenguaje pionera para aplicaciones de IA avanzadas. Explore modelos de código abierto eficientes con escalado capa por capa para mayor precisión.
-

Mistral Small 3 (2501) establece un nuevo estándar en la categoría de Modelos de Lenguaje Extensos "pequeños" por debajo de 70B, ostentando 24B parámetros y alcanzando capacidades de vanguardia comparables a modelos más grandes.
-

OpenBioLLM-8B es un modelo de lenguaje de código abierto avanzado diseñado específicamente para el dominio biomédico.
-

nanochat: Domina la pila de LLMs. Crea y despliega LLMs *full-stack* en un solo nodo con aproximadamente 1000 líneas de código personalizable, de forma asequible. Para desarrolladores.
-

WizardLM-2 8x22B es el modelo Wizard más avanzado de Microsoft AI. Demuestra un rendimiento altamente competitivo en comparación con los principales modelos propietarios y supera constantemente a todos los modelos de código abierto de última generación existentes.
-

VoxCPM: IA de Texto a Voz realista y sin *tokenizer*. Obtén una generación de voz consciente del contexto y una clonación de voz ultrarrealista para un audio natural.
-

Phi-2 es un modelo ideal para que los investigadores exploren diferentes áreas como interpretabilidad mecanicista, mejoras de seguridad y experimentos de ajuste fino.
-

StableLM Zephyr 3B es un nuevo modelo de chat que representa la última incorporación a la serie StableLM de Modelos de Lenguaje Grandes (LLM) ligeros de Stability AI.
-

ChatGLM-6B es un modelo abierto CN&EN con 6.2B paras (optimizados para respuesta a preguntas y diálogos en chino por ahora).
