Yandex YaLM

5 comments
解锁 YaLM 100B 的强大功能,它是一款类似 GPT 的神经网络,可以生成和处理文本,拥有 1000 亿个参数。面向全球的开发者和研究人员免费开放。0
访问

What is Yandex YaLM?

YaLM 100B 是一款类似于 GPT 的神经网络,用于生成和处理文本。全球各地的开发者和研究者均可免费使用。

该模型利用 1000 亿个参数。该模型在 800 个 A100 显卡和 1.7 TB 在线文本、书籍以及无数其他英文和俄文资源的集群上训练了 65 天。

有关加速和稳定的培训详细信息和最佳实践,请参阅 Medium(英文)和 Habr(俄文)文章。

他们使用 DeepSpeed 来训练模型,并从 Megatron-LM 示例中汲取灵感。但是,此存储库中的代码与用于训练模型的代码不同。相反,它是 DeepSpeed 存储库中的库存示例,只需进行最小的更改即可推断模型。

More information on Yandex YaLM

Launched
2023
Pricing Model
Free
Starting Price
Global Rank
Country
Month Visit
<5k
Tech used
Yandex YaLM was manually vetted by our editorial team and was first featured on September 4th 2024.
Aitoolnet Featured banner

Yandex YaLM 替代方案

更多 替代方案
  1. YandexGPT 2 这一 AI 语言模型在语言建模方面展现出显著提升,但可能仍提供基于

  2. GPT-NeoX-20B 是一个 200 亿参数的自动回归语言模型,使用 GPT-NeoX 库在 Pile 上进行训练。

  3. Alfred-40B-0723 是 Falcon-40B 的一个经过微调的版本,通过从人类那里进行强化学习而获得

  4. 持续研究大规模的训练 Transformer 模型

  5. TinyLlama 项目是一个开放式尝试,旨在对一个 1.1B Llama 模型进行预训练,其中包含 3 万亿个标记。