2025年最好的 SmolLM 替代方案
-

探索 Stability AI 推出的開源語言模型 StableLM。透過小巧高效的模型,在個人裝置上生成高性能的文字和程式碼。這項 AI 技術透明、易於取得且支援完善,專為開發者和研究人員而設計。
-

MiniCPM 是由 ModelBest Inc. 和 TsinghuaNLP 開發的 End-Side LLM,不包含嵌入函數的參數只有 2.4B 個(總計 2.7B 個)。
-

PolyLM 是一款革命性的多語言大型語言模型 (LLM),支援 18 種語言,在各種任務中表現卓越,且為開源項目。非常適合開發者、研究人員和企業滿足多語言需求。
-

TinyLlama 項目是一個公開的努力,旨在對一個 11 億參數的 Llama 模型進行預訓練,訓練資料集包含 3 兆個詞元。
-

-

為了加速 LLM 的推論並增強 LLM 對關鍵資訊的感知,壓縮提示和 KV 快取,在效能損失極小的情況下達到高達 20 倍的壓縮率。
-

探索 InternLM2,一款具備開放原始碼模型的 AI 工具!在長文本任務、推理、數學、程式碼解譯和創意寫作中表現出色。發掘其多功能應用和強大的工具使用能力,用於研究、應用開發和聊天互動。利用 InternLM2,提升您的 AI 格局。
-

-

OLMo 2 32B:開源大型語言模型,足以媲美 GPT-3.5!免費提供程式碼、資料與權重,供您研究、客製化,並打造更智慧的 AI。
-

StableLM Zephyr 3B 是聊天機器人新模型,代表 Stability AI 旗下輕量級大型語言模型 (LLM) StableLM 系列的最新成員。
-

-

擁有 80 億個參數,該模型在整體效能上超越了 GPT-4V-1106、Gemini Pro、Qwen-VL-Max 和 Claude 3 等專有模型。
-

LM Studio 是一款操作簡便的桌面應用程式,讓您能輕鬆體驗本地與開源的大型語言模型(LLM)。這款 LM Studio 跨平台桌面應用程式,讓您可以從 Hugging Face 下載並運行任何 ggml-相容的模型,並提供簡潔而強大的模型配置與推論介面。該應用程式會盡可能地運用您的 GPU 資源。
-

WordLlama 是一個自然語言處理 (NLP) 工具,它利用大型語言模型 (LLMs) 的組成部分來建立有效且緊湊的詞彙表示,類似於 GloVe、Word2Vec 或 FastText。
-

WizardLM-2 8x22B 是 Microsoft AI 最先進的 Wizard 模型。與領先的專有模型相比,它展現出極具競爭力的表現,並且持續勝過所有現有的最先進開源模型。
-

Qwen2.5 系列語言模型提供增強的功能,包括更大的資料集、更豐富的知識、更強的編碼和數學技能,以及更符合人類偏好的對齊。 它是開源的,可透過 API 取得。
-

-

OpenBMB:建立大型預訓練語言模型中心與工具,以加速訓練、微調和推論超過 100 億參數的大型模型。加入我們的開放原始碼社群,讓每個人都能使用大型模型。
-

介紹 StreamingLLM:一個用於在串流應用程式中部署 LLM 的高效框架。無需犧牲效能就能處理無限序列長度,並可享受高達 22.2 倍的速度優化。非常適合多輪對話和日常助理。
-

LLaMA Factory 是一個開源低代碼大型模型微調框架,它整合了業界廣泛使用的微調技術,並透過 Web UI 介面支援大型模型的零代碼微調。
-

JetMoE-8B 在不到 0.1 百萬美元1 的成本下進行訓練,但效能卻超越 Meta AI 的 LLaMA2-7B,而 Meta AI 擁有數十億美元的訓練資源。LLM 訓練可以比一般人想像中便宜許多。
-

-

Kolosal AI 是一個開放原始碼平台,讓使用者能於個人裝置上,例如筆電、桌機,甚至樹莓派,本地執行大型語言模型 (LLM),並優先考量速度、效率、隱私及環保。
-

LlamaEdge 專案讓您輕鬆在本機端執行 LLM 推論應用程式,並為 Llama2 系列的 LLM 建立與 OpenAI 相容的 API 服務。
-

ManyLLM: 整合並保障您的本機大型語言模型工作流程。一個以隱私為優先的工作區,適用於開發人員、研究人員,並具備 OpenAI API 相容性與本機 RAG 功能。
-

-

Mistral Small 3 (2501) 在 70B 以下的「小型」大型語言模型中樹立了新的標竿,它擁有 24B 個參數,並達到了可與更大模型相媲美的最先進能力!
-

-

從零開始打造 AI 模型! MiniMind 提供快速且經濟實惠的 LLM 訓練,在單一 GPU 上即可完成。 學習 PyTorch 並創建您自己的 AI。
-

探索 Code Llama,這是一款先進的 AI 工具,可進行程式碼生成和理解。提升生產力、簡化工作流程,並賦予開發人員權能。
