What is Mochi Diffusion?
Mochi Diffusion 将 Stable Diffusion 的强大功能直接带到您的 Apple Silicon Mac 上。它没有依赖 Web 界面或资源密集型虚拟环境,而是利用 Apple 的 Core ML 框架来优化性能和效率。这使您能够在本地、私密且显著降低内存消耗的情况下生成高质量的图像。如果您正在寻找 macOS 上 Stable Diffusion 的快速、原生和离线解决方案,Mochi Diffusion 就是您的答案。
主要特性:
利用 Core ML 最大化性能: 使用 Apple 的 Stable Diffusion Core ML 实现,充分利用 Apple Silicon 芯片上的神经引擎。这可以带来快速的图像生成速度和最小的内存占用(神经引擎低至约 150MB)。
离线生成图像: 完全离线创建图像,确保您的数据保持私密和安全。初始模型设置后,无需互联网连接。
支持多种生成技术: 除了基本的文本到图像生成外,Mochi Diffusion 还支持:
图像到图像 (img2img): 基于现有图像生成图像。
ControlNet: 使用 ControlNet 模型精确控制图像生成。
在图像中嵌入元数据: 自动将提示信息保存在生成的图像的 EXIF 元数据中。可以直接在 macOS Finder 的“显示简介”窗口中查看此数据。
使用 RealESRGAN 放大图像: 使用集成的 RealESRGAN 放大技术将生成的图像转换为更高的分辨率。
自动图像管理: 受益于内置的自动保存和恢复功能,无缝管理生成的图像文件。
使用您的模型进行自定义: 轻松集成您自己的自定义 Stable Diffusion Core ML 模型。Mochi Diffusion 旨在与正确转换的模型无缝协作,避免 pickled 模型的常见问题。
原生 macOS 体验: Mochi Diffusion 使用 SwiftUI 构建,提供了真正的原生 macOS 体验,与操作系统的外观和风格无缝集成。
使用场景:
快速原型设计: 快速迭代图像概念,无需依赖云服务或等待远程处理。尝试不同的提示和设置,以实时优化您的创意愿景。示例:UX 设计师可以基于草图 (img2img) 和描述性提示快速生成 UI 元素的多个变体。
离线图像创建: 在互联网连接有限或没有互联网连接的环境中生成艺术作品或视觉素材。示例:旅行中的数字艺术家可以在飞机上或偏远地区继续他们的工作。
ControlNet 微调: 使用 ControlNet 精确指导图像生成,以实现特定的艺术或技术目的。示例:建筑师可以基于详细的平面图 (ControlNet) 和描述所需风格的文本提示生成建筑设计的变体。
技术细节:
计算单元选项:
CPU & 神经引擎: 在生成速度和内存使用之间提供最佳平衡。推荐给大多数用户。
CPU & GPU: 在 M1 Max、Ultra 和更高版本的芯片上可能更快,但会消耗更多内存。
模型兼容性:
split_einsum版本: 与所有计算单元选项兼容,包括神经引擎。original版本: 仅与“CPU & GPU”计算单元选项兼容。模型管理:
默认模型文件夹:
~/MochiDiffusion/models/(可在设置中自定义)。在
models目录中为每个模型创建一个子文件夹,并将转换后的 Core ML 模型文件放入该子文件夹中。(请参阅提供的信息中的示例目录结构)。首次使用模型: 首次使用模型时,神经引擎可能需要长达 2 分钟的时间来编译缓存版本。随后使用该模型进行生成将明显更快。
结论:
Mochi Diffusion 使您能够充分利用 Apple Silicon Mac 上的 Stable Diffusion 的全部潜力。它提供无与伦比的性能、离线功能和原生 macOS 体验,使其成为开发人员、艺术家以及任何寻求强大而高效的图像生成工具的人的理想解决方案。
More information on Mochi Diffusion
Mochi Diffusion 替代方案
更多 替代方案-

Stable Diffusion 3.5 是一款尖端的 AI 图像生成平台。更快的速度、超高分辨率和直观的提示解释。释放您的创造力。
-

使用 NMKD Stable Diffusion GUI 在您的 Windows GPU 上免费生成 AI 图片。支持文本转图片、图片转图片等功能。无需复杂安装。
-

HappyDiffusion 是在移动设备和电脑上访问 Stable Diffusion Automatic1111 WebUI 最快、最简单的方式。
-

Stable Diffusion 3 Medium 是一款多模态扩散Transformer(MMDiT)文本到图像模型,在图像质量、排版、复杂提示理解和资源效率方面表现出大幅提升。
-

