2025年30个最好的 Yi-VL-34B 替代方案

Qwen2-VL

Qwen2-VL 是阿里云 Qwen 团队开发的多模态大型语言模型系列。

大语言模型免费

Qwen2-VL 替代方案

0

Aya Vision 8B

C4AI Aya Vision 8B：开源多语种视觉人工智能，用于图像理解。支持 23 种语言的 OCR、图像描述和推理。

大语言模型免费

Aya Vision 8B 替代方案

0

glm-4v-9b

GLM-4-9B 是智谱 AI 推出的最新一代 GLM-4 系列预训练模型的开源版本。

大语言模型免费

glm-4v-9b 替代方案

0

YiVal

使用 YiVal，一个企业级生成式人工智能平台，助力企业转型。以更低的成本使用 GPT-4 开发高性能应用程序。立即探索无限可能！

开发者工具免费增值

YiVal 替代方案

4

GLM-4.5V

GLM-4.5V：以先进视觉，赋能您的AI。轻松将屏幕截图转化为网页代码，自动化图形用户界面操作，并深度推理分析文档与视频。

大语言模型免费

GLM-4.5V 替代方案

0

Yi-Coder

Yi-Coder 是一系列开源代码语言模型，它在参数少于 100 亿的情况下，就能提供最先进的编码性能。

大语言模型免费

Yi-Coder 替代方案

0

CogVLM & CogAgent

CogVLM 和 CogAgent 是功能强大的开源视觉语言模型，在图像理解和多轮对话方面表现出色。

大语言模型免费

CogVLM & CogAgent 替代方案

0

Cambrian-1

Cambrian-1 是一系列以视觉为中心的跨模态大型语言模型。

大语言模型免费

Cambrian-1 替代方案

6

DeepSeek-VL2

DeepSeek-VL2，是由 DeepSeek-AI 开发的视觉-语言模型，能够处理高分辨率图像，并借助 MLA 技术提供快速响应，在视觉问答 (VQA) 和光学字符识别 (OCR) 等多种视觉任务中表现出色。它是研究人员、开发者和商业智能 (BI) 分析师的理想之选。

大语言模型免费

DeepSeek-VL2 替代方案

1

Yandex YaLM

释放 YaLM 100B 的力量，这是一个类似 GPT 的神经网络，拥有 1000 亿个参数，可以生成和处理文本。全球开发者和研究人员可免费使用。

大语言模型免费

Yandex YaLM 替代方案

0

Step-1V

步骤 1V：由极月星辰开发的高效多模态模型，在图像理解、多轮指令遵循、数学能力、逻辑推理和文本创作方面表现出卓越的性能。

大语言模型免费试用

Step-1V 替代方案

6

Bagel

BAGEL：字节跳动-Seed 开源的多模态 AI 模型。它能理解、生成和编辑图像和文本，功能强大且灵活，可与 GPT-4o 相媲美。使用 BAGEL 构建先进的 AI 应用。

大语言模型免费

Bagel 替代方案

1

MiniCPM-Llama3-V 2.5

凭借总计 80 亿个参数，该模型在整体性能方面超越了 GPT-4V-1106、Gemini Pro、Qwen-VL-Max 和 Claude 3 等专有模型。

大语言模型免费

MiniCPM-Llama3-V 2.5 替代方案

0

Mini-Gemini

Mini-Gemini 同时支持一系列从 2B 到 34B 的密集型和 MoE 大语言模型 (LLM)，并兼具图像理解、推理和生成功能。本代码库基于 LLaVA 构建。

大语言模型免费

Mini-Gemini 替代方案

0

GLM-4

基于 MaaS 的全新发展范式，通过我们通用的模型服务释放人工智能

大语言模型免费增值

GLM-4 替代方案

6

XVERSE-MoE-A36B

XVERSE-MoE-A36B: 由 XVERSE Technology Inc. 开发的多语言大型语言模型。

大语言模型免费

XVERSE-MoE-A36B 替代方案

0

CM3leon

CM3leon：一款多模态生成模型，可用于文本和图像。提升创造力，为游戏、社交媒体和电子商务创建逼真的视觉效果。

大语言模型免费

CM3leon 替代方案

33

Janus

Janus：解耦视觉编码，实现统一的多模态理解与生成

机器学习免费

Janus 替代方案

0

Ovis

一种新颖的多模态大型语言模型 (MLLM) 架构，旨在结构化地对齐视觉和文本嵌入。

大语言模型免费

Ovis 替代方案

0

Qwen2.5-LLM

Qwen2.5系列语言模型拥有更强大的功能，得益于更大的数据集、更丰富的知识储备、更出色的编码和数学能力，以及更贴近人类偏好的对齐。该模型开源且可通过API访问。

大语言模型免费

Qwen2.5-LLM 替代方案

0

EXAONE 3.5

探索LG AI Research推出的EXAONE 3.5。这是一套双语（英语和韩语）指令调优生成式模型，参数范围从24亿到320亿。支持长达32K标记的长上下文，在现实场景中表现卓越。

大语言模型免费

EXAONE 3.5 替代方案

0

PolyLM

PolyLM 是一款革命性的多语言大型语言模型 (LLM)，支持 18 种语言，在各种任务中表现出色，并且是开源的。非常适合开发者、研究人员和企业的多语言需求。

大语言模型免费

PolyLM 替代方案

0

vLLM

面向 LLM 的高吞吐量、内存高效的推理和服务引擎

开发者工具免费

vLLM 替代方案

1

Voyager

Voyager 是一个用于增强 AI 艺术生成的专业管道。Voyager 使用大约 6 倍于 SDXL 等标准模型的资源来生成独特且更高端的输出。

艺术付费

Voyager 替代方案

4

GLM-130B

GLM-130B：一个开放的双语预训练模型（ICLR 2023）

大语言模型免费

GLM-130B 替代方案

0

RWKV-LM

RWKV 是一种 RNN，拥有与 Transformer 级别 LLM 相当的性能。它可以像 GPT 一样直接进行训练（可并行化）。因此，它结合了 RNN 和 Transformer 的优点——出色的性能、快速的推理、节省 VRAM、快速的训练、"无限"的 ctx_len 以及免费的句子嵌入。

大语言模型免费

RWKV-LM 替代方案

0

Molmo AI

Molmo AI 是由 AI2 开发的开源多模态人工智能模型。它可以处理和生成各种类型的数据，包括文本和图像。

大语言模型免费试用

Molmo AI 替代方案

2

VibeVoice

VibeVoice：免费在线AI文字转语音服务。即刻生成逼真、多角色的语音对话，单次时长最高90分钟。免下载，免注册！

文本转语音免费

VibeVoice 替代方案

0

Yuan2.0-M32

Yuan2.0-M32 是一款混合专家 (MoE) 语言模型，拥有 32 个专家，其中 2 个处于活跃状态。

大语言模型免费

Yuan2.0-M32 替代方案

0

MetaVoice-1B

MetaVoice-1B 是一款 1.2B 参数基础模型，针对 100K 小时语音进行训练，用于 TTS（文本到语音）。

大语言模型免费

MetaVoice-1B 替代方案

0

Yi-VL-34B 替代方案

2025年最好的 Yi-VL-34B 替代方案

Qwen2-VL

Aya Vision 8B

glm-4v-9b

YiVal

GLM-4.5V

Yi-Coder

CogVLM & CogAgent

Cambrian-1

DeepSeek-VL2

Yandex YaLM

Step-1V

Bagel

MiniCPM-Llama3-V 2.5

Mini-Gemini

GLM-4

XVERSE-MoE-A36B

CM3leon

Janus

Ovis

Qwen2.5-LLM

EXAONE 3.5

PolyLM

vLLM

Voyager

GLM-130B

RWKV-LM

Molmo AI

VibeVoice

Yuan2.0-M32

MetaVoice-1B

Related comparisons