2025年30個最好的 Yi-VL-34B 替代方案

Qwen2-VL

Qwen2-VL 是由阿里雲 Qwen 團隊開發的多模態大型語言模型系列。

大語言模型免费

Qwen2-VL 替代方案

0

Aya Vision 8B

C4AI Aya Vision 8B：開源多語言視覺 AI，用於圖像理解。支援 23 種語言的 OCR、圖像描述和推理。

大語言模型免费

Aya Vision 8B 替代方案

0

glm-4v-9b

GLM-4-9B 是由智譜 AI 發佈的 GLM-4 系列最新一代預訓練模型的開源版本。

大語言模型免费

glm-4v-9b 替代方案

0

YiVal

利用 YiVal，一個企業級創生 AI 平台，轉型企業業務。以更低的成本開發高性能的 GPT-4 應用程式。立即探索無限的可能性！

开发者工具免費增值

YiVal 替代方案

4

GLM-4.5V

GLM-4.5V：賦予您的 AI 卓越視覺能力。可從螢幕截圖生成網頁程式碼、自動化圖形使用者介面，並能運用深度推理，精準分析文件與影片。

大語言模型免费

GLM-4.5V 替代方案

0

Yi-Coder

Yi-Coder 是一系列開源程式碼語言模型，在不到 100 億個參數的情況下，就能提供最先進的編碼效能。

大語言模型免费

Yi-Coder 替代方案

0

CogVLM & CogAgent

CogVLM 和 CogAgent 是一款功能強大的開源視覺語言模型，擅長於影像理解和多回合對話。

大語言模型免费

CogVLM & CogAgent 替代方案

0

Cambrian-1

Cambrian-1 是一個以視覺為中心的，多模態大型語言模型家族。

大語言模型免费

Cambrian-1 替代方案

6

DeepSeek-VL2

DeepSeek-VL2 是由 DeepSeek-AI 開發的視覺語言模型，它能夠處理高解析度的圖像，並透過 MLA 提供快速的回應。DeepSeek-VL2 在各種視覺任務中表現出色，例如 VQA 和 OCR。對於研究人員、開發者和 BI 分析師來說，DeepSeek-VL2 是一個理想的選擇。

大語言模型免费

DeepSeek-VL2 替代方案

1

Yandex YaLM

解鎖 YaLM 100B 的強大力量，一個類似 GPT 的神經網絡，擁有 1000 億個參數，可以生成和處理文字。全球開發者和研究人員免費使用。

大語言模型免费

Yandex YaLM 替代方案

0

Step-1V

步驟一 V：極月星辰研發的高性能多模態模型，展現出傑出的影像理解、多輪指令遵循、數學能力、邏輯推理和文字創作表現。

大語言模型免费试用

Step-1V 替代方案

6

Bagel

BAGEL：字節跳動-Seed 開源的多模態人工智慧模型。能理解、生成、編輯圖像和文字。功能強大、靈活，堪比 GPT-4o。可用於構建先進的人工智慧應用程式。

大語言模型免费

Bagel 替代方案

1

MiniCPM-Llama3-V 2.5

擁有 80 億個參數，該模型在整體效能上超越了 GPT-4V-1106、Gemini Pro、Qwen-VL-Max 和 Claude 3 等專有模型。

大語言模型免费

MiniCPM-Llama3-V 2.5 替代方案

0

Mini-Gemini

Mini-Gemini 支援一系列 2B 到 34B 的 LLMs（大型語言模型），同時具有影像理解、推理和生成功能。我們基於 LLaVA 建立此儲存庫。

大語言模型免费

Mini-Gemini 替代方案

0

GLM-4

基於 MaaS 的開發新典範，利用我們通用的模型服務釋放 AI 的潛力

大語言模型免費增值

GLM-4 替代方案

6

XVERSE-MoE-A36B

XVERSE-MoE-A36B：由 XVERSE Technology Inc. 開發的多語言大型語言模型。

大語言模型免费

XVERSE-MoE-A36B 替代方案

0

CM3leon

CM3leon：一個多功能的多模態生成模型，適用於文字和圖片。提升創意，為遊戲、社群媒體和電子商務創造逼真的視覺效果。

大語言模型免费

CM3leon 替代方案

33

Janus

Janus: 解耦視覺編碼以實現統一的多模態理解和生成 Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation

机器学习免费

Janus 替代方案

0

Ovis

一種新穎的多模態大型語言模型 (MLLM) 架構，旨在結構化地對齊視覺和文字嵌入。

大語言模型免费

Ovis 替代方案

0

Qwen2.5-LLM

Qwen2.5 系列語言模型提供增強的功能，包括更大的資料集、更豐富的知識、更強的編碼和數學技能，以及更符合人類偏好的對齊。它是開源的，可透過 API 取得。

大語言模型免费

Qwen2.5-LLM 替代方案

0

EXAONE 3.5

探索LG AI Research的EXAONE 3.5。這是一套雙語（英語和韓語）指令微調生成式模型，參數規模從24億到320億不等。支援長達32K個詞元的長上下文處理，在真實場景中表現卓越。

大語言模型免费

EXAONE 3.5 替代方案

0

PolyLM

PolyLM 是一款革命性的多語言大型語言模型 (LLM)，支援 18 種語言，在各種任務中表現卓越，且為開源項目。非常適合開發者、研究人員和企業滿足多語言需求。

大語言模型免费

PolyLM 替代方案

0

vLLM

LLM 的高通量及記憶體用量有效推論與服務引擎

开发者工具免费

vLLM 替代方案

1

Voyager

Voyager 是專業的管道，可增強 AI 藝術生成。Voyager 使用比 SDXL 等標準模型多約 6 倍的資源，可產生獨特且更高級的輸出。

藝術付款

Voyager 替代方案

4

GLM-130B

GLM-130B：一個開放的雙語預先訓練模型 (ICLR 2023)

大語言模型免费

GLM-130B 替代方案

0

RWKV-LM

RWKV 是一種具有 Transformer 層級 LLM 效能的 RNN。它能像 GPT 一樣直接接受訓練（可平行運算）。因此，它結合了 RNN 和 Transformer 的最佳優勢：效能佳、推論快、節省 VRAM、訓練快、「無窮」ctx_len，以及提供句子嵌入。

大語言模型免费

RWKV-LM 替代方案

0

Molmo AI

Molmo AI 是一款由 AI2 開發的開源多模態人工智慧模型。它可以處理和生成各種類型的資料，包括文字和圖片。

大語言模型免费试用

Molmo AI 替代方案

2

VibeVoice

VibeVoice：免費線上 AI 語音合成。即時生成逼真寫實、多角色語音對話，長度最長可達 90 分鐘。無需下載，免註冊！

文字转语音免费

VibeVoice 替代方案

0

Yuan2.0-M32

Yuan2.0-M32 是一個混合專家 (MoE) 語言模型，擁有 32 個專家，其中 2 個處於活躍狀態。

大語言模型免费

Yuan2.0-M32 替代方案

0

MetaVoice-1B

MetaVoice-1B 係一款 1.2B 參數基礎模型，經由 100K 小時語音訓練，用於 TTS（文字轉語音）。

大語言模型免费

MetaVoice-1B 替代方案

0

Yi-VL-34B 替代方案

2025年最好的 Yi-VL-34B 替代方案

Qwen2-VL

Aya Vision 8B

glm-4v-9b

YiVal

GLM-4.5V

Yi-Coder

CogVLM & CogAgent

Cambrian-1

DeepSeek-VL2

Yandex YaLM

Step-1V

Bagel

MiniCPM-Llama3-V 2.5

Mini-Gemini

GLM-4

XVERSE-MoE-A36B

CM3leon

Janus

Ovis

Qwen2.5-LLM

EXAONE 3.5

PolyLM

vLLM

Voyager

GLM-130B

RWKV-LM

Molmo AI

VibeVoice

Yuan2.0-M32

MetaVoice-1B

Related comparisons