在 Windows GPU 云服务器上安装和使用 Stable Diffusion 3.5

在当下生成式 AI 日益成为内容创作者与设计工作室的重要“武器”的背景下，Stable Diffusion 3.5 以更高的图像质量、更强的语义理解力和更快的生成速度脱颖而出。本文将指导您在运行 Windows 系统的 GPU 云服务器（VPS）上安装与使用 Stable Diffusion 3.5 —— 这是当您需要强大性能、可通过 RDP 远程工作、并希望获得灵活扩展能力而无需投入昂贵工作站时的理想选择。

Mục lục

1. Stable Diffusion 是什么?

Stable Diffusion 是由 Stability AI 开发的生成式人工智能（Generative AI）模型，能够根据文字描述（text-to-image）生成接近专业水准的图像。

其原理是通过“反向扩散（reverse diffusion）”的方式，从随机噪声（noise）中逐步还原出完整的图像，并根据用户输入的提示词（prompt）进行创作。

Stable Diffusion 的优势:

开源免费（Open Source）：完全免费，可安装在任何操作系统上（Windows、Linux、macOS、GPU 云服务器等）。
高度可定制：支持添加模型、Checkpoint、LoRA、ControlNet、VAE，或通过 ComfyUI、AUTOMATIC1111 等界面构建自定义工作流。
无需联网：若云服务器已安装完整模型，可实现 100% 离线运行。
庞大的开发者社区：在 Civitai、Hugging Face、GitHub 等平台上有数十万模型与工作流资源可供下载与分享。

Stable Diffusion 3.5 是 Stability AI 于 2025 年中发布的最新一代图像生成式 AI 模型。

它是 Stable Diffusion 3 系列的重大升级版本，拥有更高的图像质量、更强的稳定性以及卓越的语义理解能力。该版本采用了融合 Transformer 与 Diffusion 的混合式 text-to-image 架构，在细节表现与生成一致性方面都有显著提升。

Stable Diffusion 3.5 相较于其他 AI 模型的出色表现（来源：Stability.ai）

Stable Diffusion 3.5 的主要亮点:

更强的语义理解力：能精准描绘复杂场景、光影与自然构图，比 SDXL 更贴近人类视觉逻辑。
更高的图像质量：细节丰富、光线与色彩自然，效果接近 Midjourney v6。
完美兼容 ComfyUI：支持节点图（Node Graph）、LoRA、ControlNet、T2I Adapter 与 AnimateDiff 等扩展。
针对 RTX GPU 优化：在显存 ≥12GB 的 GPU（如 RTX 3060、4070、4090、A5000）上运行最为高效。
轻松扩展：可灵活添加不同模型或 Checkpoint（如 sd3.5-large、sd3.5-medium、turbo）以提升生成速度与多样性。

2. 运行 Stable Diffusion 3.5 的推荐云服务器（VPS）配置

组件	运行 SD 3.5 的最低配置	推荐配置（流畅稳定）
GPU	NVIDIA GPU VRAM ≥ 8GB (RTX 2060 / A10G)	RTX 3060 / RTX 4070 / RTX 4090 / A5000
CPU	4 核及以上	8–16 核（AMD Ryzen 或 Xeon）
内存（RAM）	16GB	32GB 以上（适合运行含多节点的 ComfyUI 工作流）
存储（SSD）	≥ 50GB（SD3.5 模型约 18GB）	≥ 100GB（可存放更多模型、LoRA 与纹理资源）
操作系统	Windows 10/11 或 Windows Server 2019+	Windows Server 2022 (64-bit)
网络	≥100 Mbps	≥ 1 Gbps（可更快下载模型与依赖文件）

注意： Stable Diffusion 3.5 对显存的要求高于 SDXL，因此如果您希望稳定生成 1024×1024 图像或 AI 视频，建议选择显存 ≥12GB 的 GPU。

Stable Diffusion 3.5 推荐使用的 GPU 与显存配置（来源：Stability.ai）

3. 在 Windows 系统中通过 ComfyUI 安装 Stable Diffusion 的教程

步骤 1：连接到 Windows 云服务器（VPS）

对于 Windows 云服务器，请使用系统自带的远程桌面连接（Remote Desktop Connection）应用程序。打开后，输入服务器的 IP 地址、用户名和密码，即可远程登录到 VPS。

步骤 2：下载 ComfyUI

如果您之前在本地运行过旧版本的 Stable Diffusion，可能已经熟悉 AUTOMATIC1111 的界面。然而，现在 ComfyUI 更加适配并全面支持 Stable Diffusion 3.5（尤其是新架构模型 SD 3 与 SD 3.5）。事实上，Stable Diffusion 的开发公司 Stability AI 官方也推荐使用 ComfyUI 来运行 SD 3.5 完整版本。以下是详细的安装步骤说明：

首先，通过以下链接下载 ComfyUI，向下滚动页面，找到并点击相应的安装包进行下载。

ComfyUI_windows_portable_nvidia.7z

下载完成后，请将压缩包进行解压缩。需要注意的是：如果您的 GPU 云服务器运行的是 Windows 10，可能需要先安装 WinRAR 或其他解压工具，才能正常解压文件。大家可以通过以下链接下载 WinRAR 安装程序。

步骤 3：下载 Stable Diffusion 3.5

此处我们将下载当前最新的 Stable Diffusion 3.5（large 模型）。大家也可以根据自己的系统配置，选择合适的模型版本进行下载。

进入以下链接后，先登录或注册账号，然后填写您的企业信息（如果没有，可随意填写任意企业资料），并勾选同意模型使用条款以获取下载权限。

接着进入 “Files and versions” 页面，向下滚动查找并下载以下两个文件： SD3.5L_example_workflow.json 和 sd3.5_large.safetensors

步骤 4：下载 Clip 文件

请依次下载以下三个文件：

clip_g.safetensors

clip_l.safetensors

t5xxl_fp16.safetensors

如果您的内存较小，可以选择安装 clip 模型 t5xxl_fp8_e4m3fn.safetensors 以替代 fp16 版本，从而降低资源占用。

如果您在打开链接时提示“无访问权限”，如上图所示，这通常是因为您之前仅提交并同意了 SD 3.5 large 版本的使用条款，而当前链接指向的是 SD 3.5 medium 版本的仓库。因此，您需要重新填写信息并再次确认该版本的使用条款后，才能获得下载权限。

请前往以下链接重新填写信息并提交申请：

然后重新进入前面的链接，按照正常方式下载那 3 个文件即可。

之所以需要访问 SD 3.5 Medium 的仓库，是因为 SD 3.5 Large 与 SD 3.5 Medium 两个模型共用同一套文本编码器（Text Encoder）文件，即：clip_g, clip_l, 和 t5xxl_fp16。不过，这三份文件仅在 SD 3.5 Medium 的仓库中单独提供下载，因此必须通过该页面获取。

步骤 5：开始安装 Stable Diffusion 3.5

请注意，这一步非常关键，务必严格按照以下指引操作，确保安装过程顺利完成。

在下载完所有必要文件后，打开之前已解压的 ComfyUI_windows_portable_nvidia 文件夹。请在 ComfyUI_windows_portable_nvidia 文件夹中，按照以下路径找到 checkpoints 目录：

ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\checkpoints

在此目录下，将之前下载的 sd3.5_large.safetensors 文件粘贴进去即可。

接着，进入以下路径中的 clip 文件夹。该文件夹与 checkpoints 位于同一个 models 目录下，因此只需返回上一级文件夹即可看到。

ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\clip

然后，将在步骤 3 中下载的 3 个 clip 文件粘贴到此文件夹中即可。

步骤 6：运行 ComfyUI 启动脚本

返回到 ComfyUI_windows_portable 文件夹，您会看到其中包含两个 .bat 启动脚本文件。

如果您的系统没有 NVIDIA 显卡，请运行 run_cpu.bat 文件以使用 CPU 模式启动。需要注意的是，使用 CPU 运行的速度会比使用 NVIDIA GPU 慢得多。

如果您的云服务器或电脑已配备 NVIDIA 显卡，请运行 run_nvidia_gpu.bat 文件以使用 GPU 模式。双击启动后，等待几分钟，系统将自动下载并安装所需依赖。

脚本运行完成后，将自动打开 Stable Diffusion 的控制面板（Control Panel）。此时，只需将之前在步骤 3 下载的 SD3.5L_example_workflow.json 文件拖拽到该界面中，即可快速加载示例工作流并开始使用。

在 TripleCLIPLoader 模块中，选择与之前下载的 clip 文件名称相对应的选项。
至此，我们已经成功在本地（local host）完成 Stable Diffusion 的安装与配置！

4. Stable Diffusion 快速使用指南

在 CLIP Text Encode（Prompt）区域输入您的提示词（Prompt）

此外，您还可以在 EmptySD3LatentImage 模块中调整一些参数，例如图像分辨率。

请注意：图像尺寸必须为 64 的倍数。

填写完所有信息后，点击界面右侧的 Queue Prompt（或某些版本中显示为 Queue）按钮，即可开始生成图像。

稍等片刻，生成的图像将会显示在 Preview Image（预览图像）区域。生成速度取决于您服务器的硬件配置。以 TotHost 的 RTX 5880 GPU 云服务器为例，生成一张图像大约只需约 28 秒。

可以看到，生成的效果相当出色——最令人惊喜的是，它完全免费，不限生成次数与下载次数！图像质量极为清晰细腻，堪称专业级水准。

5. 结论

以上内容为您详细介绍了如何选择合适的配置、在 Windows 系统的 GPU 云服务器上安装与使用 Stable Diffusion 3.5。
如果您希望获得一套为 Stable Diffusion 3.5 预先优化的 GPU 云服务器方案，并享受快速支持与灵活扩展能力，欢迎选择 TotHost 的相关服务套餐，即刻开启您的 AI 创作之旅。