Las mejores SmolLM alternativas en 2025
-

Descubre StableLM, un modelo de lenguaje de código abierto de Stability AI. Genera texto y código de alto rendimiento en dispositivos personales con modelos pequeños y eficientes. Tecnología de IA transparente, accesible y de apoyo para desarrolladores e investigadores.
-

MiniCPM es un LLM de fin lateral desarrollado por ModelBest Inc. y TsinghuaNLP, con solo 2.4B parámetros excluyendo incrustaciones (2.7B en total).
-

PolyLM, un revolucionario modelo lingüístico poliglota (LLM), admite 18 idiomas, sobresale en diversas tareas y es de código abierto. Ideal para desarrolladores, investigadores y empresas con necesidades multilingües.
-

El proyecto TinyLlama es una iniciativa abierta para preentrenar un modelo Llama de 1.1B en 3 billones de tokens.
-

Una familia de modelos de lenguaje pionera para aplicaciones de IA avanzadas. Explore modelos de código abierto eficientes con escalado capa por capa para mayor precisión.
-

Para acelerar la inferencia de los LLM y mejorar la percepción de los LLM de información clave, comprime el indicador y KV-Cache, que logra una compresión de hasta 20 veces con una pérdida de rendimiento mínima.
-

¡Explora InternLM2, una herramienta de IA con modelos abiertos! Destaca en tareas de contexto extenso, razonamiento, matemáticas, interpretación de código y redacción creativa. Descubre sus aplicaciones versátiles y sus sólidas capacidades de utilización de herramientas para la investigación, el desarrollo de aplicaciones y las interacciones de chat. Mejora tu panorama de IA con InternLM2.
-

Un motor de inferencia y servicio de alto rendimiento y bajo consumo de memoria para LLM
-

¡OLMo 2 32B: El LLM de código abierto que desafía a GPT-3.5! Código, datos y pesos gratuitos. Investiga, personaliza y crea una IA más inteligente.
-

StableLM Zephyr 3B es un nuevo modelo de chat que representa la última incorporación a la serie StableLM de Modelos de Lenguaje Grandes (LLM) ligeros de Stability AI.
-

Mejora los modelos de lenguaje, mejora el rendimiento y obtiene resultados precisos. WizardLM es la herramienta definitiva para tareas de codificación, matemáticas y PNL.
-

Con un total de 8 mil millones de parámetros, el modelo supera a modelos propietarios como GPT-4V-1106, Gemini Pro, Qwen-VL-Max y Claude 3 en rendimiento general.
-

LM Studio es una aplicación de escritorio fácil de usar para experimentar con Modelos de Lenguaje Grandes (LLMs) locales y de código abierto. La aplicación de escritorio multiplataforma LM Studio permite descargar y ejecutar cualquier modelo compatible con ggml de Hugging Face, y proporciona una interfaz de usuario (UI) sencilla pero potente para la configuración e inferencia de modelos. La aplicación aprovecha tu GPU cuando es posible.
-

WordLlama es una herramienta para el procesamiento del lenguaje natural (NLP) que recicla componentes de modelos de lenguaje grandes (LLMs) para crear representaciones de palabras eficientes y compactas, similares a GloVe, Word2Vec o FastText.
-

WizardLM-2 8x22B es el modelo Wizard más avanzado de Microsoft AI. Demuestra un rendimiento altamente competitivo en comparación con los principales modelos propietarios y supera constantemente a todos los modelos de código abierto de última generación existentes.
-

Los modelos de lenguaje de la serie Qwen2.5 ofrecen capacidades mejoradas con conjuntos de datos más grandes, más conocimiento, mejores habilidades de codificación y matemáticas, y una alineación más cercana a las preferencias humanas. De código abierto y disponible a través de API.
-

Mejora tus aplicaciones de IA con smol.ai, la plataforma innovadora para ingenieros de IA. Disfruta de una integración perfecta y una eficiencia de rendimiento con modelos ajustados. ¡Pruébalo ya!
-

OpenBMB: Creación de un centro de modelos de lenguaje preentrenados a gran escala y herramientas para acelerar la formación, el ajuste y la inferencia de modelos grandes con más de 10 mil millones de parámetros. Únete a nuestra comunidad de código abierto y haz que los modelos grandes lleguen a todos.
-

Presentamos StreamingLLM: Un marco eficiente para implementar LLM en aplicaciones en tiempo real. Controla secuencias de longitud infinita sin sacrificar el rendimiento y disfruta de optimizaciones de velocidad de hasta 22,2x. Ideal para diálogos multironda y asistentes diarios.
-

LLaMA Factory es un marco de ajuste fino de modelos grandes de código bajo de código abierto que integra las técnicas de ajuste fino ampliamente utilizadas en la industria y admite el ajuste fino de modelos grandes sin código a través de la interfaz de usuario web.
-

JetMoE-8B se entrenó con un costo de menos de $ 0,1 millones, pero supera a LLaMA2-7B de Meta AI, que cuenta con recursos de capacitación multimillonarios. La capacitación de LLM puede ser mucho más económica de lo que generalmente se cree.
-

Indicación LLM robusta y modular usando tipos, plantillas, restricciones y un tiempo de ejecución optimizador.
-

Kolosal AI es una plataforma de código abierto que permite a los usuarios ejecutar modelos lingüísticos de gran tamaño (LLM) localmente en dispositivos como portátiles, ordenadores de sobremesa e incluso Raspberry Pi, priorizando la velocidad, la eficiencia, la privacidad y el respeto al medio ambiente.
-

El proyecto LlamaEdge facilita la ejecución local de aplicaciones de inferencia LLM y la creación de servicios API compatibles con OpenAI para la serie Llama2 de LLMs.
-

ManyLLM: Unifica y protege tus flujos de trabajo LLM locales. Un espacio de trabajo donde la privacidad es lo primero para desarrolladores e investigadores, con compatibilidad con la API de OpenAI y RAG local.
-

Molmo AI es un modelo de inteligencia artificial multimodal de código abierto desarrollado por AI2. Puede procesar y generar varios tipos de datos, incluyendo texto e imágenes.
-

Mistral Small 3 (2501) establece un nuevo estándar en la categoría de Modelos de Lenguaje Extensos "pequeños" por debajo de 70B, ostentando 24B parámetros y alcanzando capacidades de vanguardia comparables a modelos más grandes.
-

Llamafile es un proyecto del equipo de Mozilla. Permite a los usuarios distribuir y ejecutar LLM utilizando un archivo único e independiente de la plataforma.
-

¡Crea modelos de IA desde cero! MiniMind ofrece un entrenamiento rápido y asequible de LLM en una sola GPU. Aprende PyTorch y crea tu propia IA.
-

Descubre Code Llama, una herramienta de IA de vanguardia para la generación y comprensión de código. Aumenta la productividad, agiliza los flujos de trabajo y facilita la labor de los desarrolladores.
