What is Qwen3 Embedding?

Qwen3 Embedding 模型系列为文本数据表示与排序提供了先进、多功能的解决方案，旨在赋能您的多语言、多任务应用。该系列基于强大的 Qwen3 基础模型构建，提供全面丰富的嵌入与重排序模型，性能卓越、灵活多变，助您实现更深层次的文本理解，并提升系统相关性。

🌍 卓越的多语言能力： 支持超过100种语言，涵盖多种编程语言。这使得模型能够实现强大的多语言、跨语言及代码检索能力，助您有效处理全球多样化的文本数据。
📊 业界领先的性能： 在广泛的下游应用中取得领先成果。Qwen3-Embedding-8B 模型在 MTEB 多语言排行榜上名列第一（截至2025年6月5日，得分70.58），彰显其在多样化任务中出色的文本语义表示能力。重排序模型在文本检索场景中也能显著提升相关性。
⚙️ 灵活的架构与高度定制性： 嵌入和重排序模型均提供多种尺寸（0.6B、4B、8B）供选择，助您根据特定需求在效率和效果之间取得平衡。嵌入模型支持用户自定义输出维度（从32到4096），从而优化您的应用成本。
🎯 指令感知能力： 通过提供用户自定义指令，提升模型在特定任务、语言或场景中的表现。评估结果显示，使用指令通常能带来1%到5%的性能提升，助您精细调整模型行为以获得最佳效果。

有效理解和比较文本对于许多应用至关重要。Qwen3 Embedding 系列提供了将文本转化为有意义的数值表示（嵌入），并基于相关性准确地对搜索结果进行重新排序（重排序）的工具。

构建先进的搜索与检索系统： 创建高相关性的搜索引擎或文档检索系统，这些系统能够跨语言、跨内容类型（包括代码）运行。嵌入模型能高效捕捉文本含义，而重排序模型则能精炼结果以实现精准度。
优化文本分类与聚类： 通过使用高质量、语义丰富的嵌入，即使是多语言数据集，也能更好地捕捉数据的细微差别，从而提升您的文本分类和聚类模型的性能。
赋能双语文本挖掘与跨语言应用： 精确识别平行句或对齐不同语言的文本，助力机器翻译训练数据准备或跨语言信息检索等任务。

Qwen3 Embedding 系列独特结合了顶级的多语言性能、灵活的模型尺寸以及指令感知和维度控制等强大的定制功能。这使得您能够构建高性能、经济高效且具备全球化视野的文本理解应用。

Qwen3 Embedding 模型系列提供了强大、灵活、多语言的能力，助您应对复杂的文本表示与排序挑战。凭借其业界领先的性能和可定制的架构，您可以在广泛领域构建更智能、更高效的应用。

探索 Qwen3 Embedding 如何赋能您的文本应用。

嵌入模型 接收单个文本（如句子或段落），并将其转化为一个固定大小的数值向量（即嵌入），该向量能够捕捉其语义。这些向量可用于相似性搜索、聚类，或作为其他机器学习模型的输入。
重排序模型 接收一对文本（如用户查询和潜在搜索结果），并输出一个相关性分数，以表明两者之间的紧密程度。它们通常在初始检索步骤之后使用，用于优化结果的顺序，从而提高准确性。

指令感知功能允许您在输入文本前添加特定的指令（例如：“Represent the following sentence for retrieval:”或“Identify the main topic of this text:”）。这会引导模型生成更符合您特定任务或上下文需求的嵌入或分数，从而通常带来性能提升。尽管模型支持多种语言，但由于大多数训练指令均以英文编写，我们建议您使用英文撰写指令。

该系列提供0.6亿、40亿和80亿参数模型。更大的模型（如80亿参数模型）通常能提供更高的性能和更好的语义理解能力，适用于对准确性要求极高的任务。较小的模型（如0.6亿和40亿参数模型）则在性能和效率之间取得平衡，非常适合计算资源或推理速度受限的应用场景。您可以根据具体的性能、延迟和成本要求选择最合适的尺寸。

More information on Qwen3 Embedding

Launched

Pricing Model

Free

Starting Price

Global Rank

Month Visit

<5k

Tech used

Qwen3 Embedding was manually vetted by our editorial team and was first featured on 2025-06-08.

更多替代方案