2025年最好的 MiniCPM-2B 替代方案
-

擁有 80 億個參數,該模型在整體效能上超越了 GPT-4V-1106、Gemini Pro、Qwen-VL-Max 和 Claude 3 等專有模型。
-

MiniCPM3-4B 是 MiniCPM 系列的第三代。MiniCPM3-4B 的整體效能超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,與許多近期 7B~9B 模型相當。
-

-

從零開始打造 AI 模型! MiniMind 提供快速且經濟實惠的 LLM 訓練,在單一 GPU 上即可完成。 學習 PyTorch 並創建您自己的 AI。
-

OpenBMB:建立大型預訓練語言模型中心與工具,以加速訓練、微調和推論超過 100 億參數的大型模型。加入我們的開放原始碼社群,讓每個人都能使用大型模型。
-

-

PolyLM 是一款革命性的多語言大型語言模型 (LLM),支援 18 種語言,在各種任務中表現卓越,且為開源項目。非常適合開發者、研究人員和企業滿足多語言需求。
-

JetMoE-8B 在不到 0.1 百萬美元1 的成本下進行訓練,但效能卻超越 Meta AI 的 LLaMA2-7B,而 Meta AI 擁有數十億美元的訓練資源。LLM 訓練可以比一般人想像中便宜許多。
-

-

MiniMax-M1:一款開放權重AI模型,擁有百萬token的超長上下文視窗,並具備卓越的深度推理能力。能高效處理海量資料,為各種先進AI應用提供強大支援。
-

探索 InternLM2,一款具備開放原始碼模型的 AI 工具!在長文本任務、推理、數學、程式碼解譯和創意寫作中表現出色。發掘其多功能應用和強大的工具使用能力,用於研究、應用開發和聊天互動。利用 InternLM2,提升您的 AI 格局。
-

認識 PaLM 2,Google 的先進語言模型,可以執行推理、翻譯和編碼任務。PaLM 2 採用負責任的人工智慧實踐,在多語言協作和專用程式碼生成方面表現優異。
-

OLMo 2 32B:開源大型語言模型,足以媲美 GPT-3.5!免費提供程式碼、資料與權重,供您研究、客製化,並打造更智慧的 AI。
-

為了加速 LLM 的推論並增強 LLM 對關鍵資訊的感知,壓縮提示和 KV 快取,在效能損失極小的情況下達到高達 20 倍的壓縮率。
-

Qwen2.5 系列語言模型提供增強的功能,包括更大的資料集、更豐富的知識、更強的編碼和數學技能,以及更符合人類偏好的對齊。 它是開源的,可透過 API 取得。
-

TinyLlama 項目是一個公開的努力,旨在對一個 11 億參數的 Llama 模型進行預訓練,訓練資料集包含 3 兆個詞元。
-

iconicon嘻哈歌手arrow56/5000iconMiniMax 是最新一代的大型中文語言模型,其主要目標是幫助人類高效寫作、激發創造力、獲取知識和決策。
-

探索 Stability AI 推出的開源語言模型 StableLM。透過小巧高效的模型,在個人裝置上生成高性能的文字和程式碼。這項 AI 技術透明、易於取得且支援完善,專為開發者和研究人員而設計。
-

-

-

Mini-Gemini 支援一系列 2B 到 34B 的 LLMs(大型語言模型),同時具有影像理解、推理和生成功能。我們基於 LLaVA 建立此儲存庫。
-

-

Mistral Small 3 (2501) 在 70B 以下的「小型」大型語言模型中樹立了新的標竿,它擁有 24B 個參數,並達到了可與更大模型相媲美的最先進能力!
-

OpenBioLLM-8B 是一個先進的開放原始碼語言模型,專門設計用於生物醫學領域。
-

nanochat: 駕馭 LLM 技術棧。運用約千行可自訂的程式碼,以經濟實惠的方式在單一節點上建構及部署全端 LLM。專為開發者設計。
-

WizardLM-2 8x22B 是 Microsoft AI 最先進的 Wizard 模型。與領先的專有模型相比,它展現出極具競爭力的表現,並且持續勝過所有現有的最先進開源模型。
-

-

-

StableLM Zephyr 3B 是聊天機器人新模型,代表 Stability AI 旗下輕量級大型語言模型 (LLM) StableLM 系列的最新成員。
-

