1. Stable Diffusion 是什么? Stable Diffusion 是由 Stability AI 开发的生成式人工智能(Generative AI)模型,能够根据 文字描述(text-to-image) 生成接近专业水准的图像。
其原理是通过“ 反向扩散(reverse diffusion) ”的方式,从随机噪声(noise)中逐步还原出完整的图像,并根据用户输入的提示词(prompt)进行创作。
Stable Diffusion 的优势:
开源免费 (Open Source) : 完全免费,可安装在任何操作系统上(Windows、Linux、macOS、GPU 云服务器等)。
高度可定制: 支持添加模型、Checkpoint、LoRA、ControlNet、VAE,或通过 ComfyUI、AUTOMATIC1111 等界面构建自定义工作流。
无需联网: 若云服务器已安装完整模型,可实现 100% 离线运行。
庞大的开发者社区: 在 Civitai、Hugging Face、GitHub 等平台上有数十万模型与工作流资源可供下载与分享。
Stable Diffusion 3.5 是 Stability AI 于 2025 年中发布的最新一代图像生成式 AI 模型。
它是 Stable Diffusion 3 系列 的重大升级版本,拥有更高的图像质量、更强的稳定性以及卓越的语义理解能力。该版本采用了 融合 Transformer 与 Diffusion 的混合式 text-to-image 架构,在细节表现与生成一致性方面都有显著提升。
Stable Diffusion 3.5 的主要亮点:
更强的语义理解力: 能精准描绘复杂场景、光影与自然构图,比 SDXL 更贴近人类视觉逻辑。
更高的图像质量: 细节丰富、光线与色彩自然,效果接近 Midjourney v6 。
完美兼容 ComfyUI: 支持节点图(Node Graph)、LoRA、ControlNet、T2I Adapter 与 AnimateDiff 等扩展。
针对 RTX GPU 优化: 在显存 ≥12GB 的 GPU(如 RTX 3060、4070、4090、A5000)上运行最为高效。
轻松扩展: 可灵活添加不同模型或 Checkpoint(如 sd3.5-large、sd3.5-medium、turbo)以提升生成速度与多样性。
2. 运行 Stable Diffusion 3.5 的推荐云服务器(VPS)配置 组件
运行 SD 3.5 的最低配置
推荐配置(流畅稳定)
GPU
NVIDIA GPU VRAM ≥ 8GB (RTX 2060 / A10G)
RTX 3060 / RTX 4070 / RTX 4090 / A5000
CPU
4 核及以上
8–16 核(AMD Ryzen 或 Xeon)
内存
(RAM)
16GB
32GB 以上(适合运行含多节点的 ComfyUI 工作流)
存储
(SSD)
≥ 50GB(SD3.5 模型约 18GB)
≥ 100GB(可存放更多模型、LoRA 与纹理资源)
操作系统
Windows 10/11 或 Windows Server 2019+
Windows Server 2022 (64-bit)
网络
≥100 Mbps
≥ 1 Gbps(可更快下载模型与依赖文件)
注意: Stable Diffusion 3.5 对显存的要求高于 SDXL,因此如果您希望稳定生成 1024×1024 图像 或 AI 视频,建议选择 显存 ≥12GB 的 GPU。
Stable Diffusion 3.5 推荐使用的 GPU 与显存配置(来源:Stability.ai) 3. 在 Windows 系统中通过 ComfyUI 安装 Stable Diffusion 的教程 步骤 1:连接到 Windows 云服务器(VPS)
对于 Windows 云服务器,请使用系统自带的 远程桌面连接(Remote Desktop Connection) 应用程序。打开后,输入服务器的 IP 地址、用户名和密码 ,即可远程登录到 VPS。
步骤 2:下载 ComfyUI
如果您之前在本地运行过旧版本的 Stable Diffusion,可能已经熟悉 AUTOMATIC1111 的界面。然而,现在 ComfyUI 更加适配并全面支持 Stable Diffusion 3.5(尤其是新架构模型 SD 3 与 SD 3.5)。事实上,Stable Diffusion 的开发公司 Stability AI 官方也推荐使用 ComfyUI 来运行 SD 3.5 完整版本。以下是详细的安装步骤说明:
首先,通过 以下链接下载 ComfyUI,向下滚动页面,找到并点击相应的安装包进行下载。
ComfyUI_windows_portable_nvidia.7z
下载完成后,请将压缩包进行解压缩。需要注意的是:如果您的 GPU 云服务器运行的是 Windows 10,可能需要先安装 WinRAR 或其他解压工具,才能正常解压文件。大家可以通过 以下链接 下载 WinRAR 安装程序。
步骤 3:下载 Stable Diffusion 3.5
此处我们将下载当前最新的 Stable Diffusion 3.5(large 模型) 。大家也可以根据自己的系统配置,选择合适的模型版本进行下载。
进入 以下链接 后,先登录或注册账号,然后填写您的企业信息(如果没有,可随意填写任意企业资料),并勾选同意 模型使用条款 以获取下载权限。
接着进入 “Files and versions” 页面,向下滚动查找并下载以下两个文件: SD3.5L_example_workflow.json 和 sd3.5_large.safetensors
步骤 4:下载 Clip 文件
请依次下载以下三个文件:
clip_g.safetensors
clip_l.safetensors
t5xxl_fp16.safetensors
如果您的内存较小,可以选择安装 clip 模型 t5xxl_fp8_e4m3fn.safetensors 以替代 fp16 版本,从而降低资源占用。
如果您在打开链接时提示“无访问权限”,如上图所示,这通常是因为您之前仅提交并同意了 SD 3.5 large 版本的使用条款,而当前链接指向的是 SD 3.5 medium 版本的仓库。因此,您需要重新填写信息并再次确认该版本的使用条款后,才能获得下载权限。
请前往 以下链接 重新填写信息并提交申请:
然后重新进入前面的链接,按照正常方式下载那 3 个文件 即可。
之所以需要访问 SD 3.5 Medium 的仓库,是因为 SD 3.5 Large 与 SD 3.5 Medium 两个模型共用同一套 文本编码器(Text Encoder)文件,即: clip_g , clip_l , 和 t5xxl_fp16 。不过,这三份文件仅在 SD 3.5 Medium 的仓库中单独提供下载,因此必须通过该页面获取。
步骤 5:开始安装 Stable Diffusion 3.5
请注意,这一步非常关键,务必严格按照以下指引操作,确保安装过程顺利完成。
在下载完所有必要文件后,打开之前已解压的 ComfyUI_windows_portable_nvidia 文件夹。请在 ComfyUI_windows_portable_nvidia 文件夹中,按照以下路径找到 checkpoints 目录:
ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\checkpoints
在此目录下,将之前下载的 sd3.5_large.safetensors 文件粘贴进去即可。
接着,进入以下路径中的 clip 文件夹。该文件夹与 checkpoints 位于同一个 models 目录下,因此只需返回上一级文件夹即可看到。
ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\clip
然后,将在步骤 3 中下载的 3 个 clip 文件 粘贴到此文件夹中即可。
步骤 6:运行 ComfyUI 启动脚本
返回到 ComfyUI_windows_portable 文件夹,您会看到其中包含两个 .bat 启动脚本文件 。
如果您的系统没有 NVIDIA 显卡 ,请运行 run_cpu.bat 文件以使用 CPU 模式启动。需要注意的是,使用 CPU 运行的速度会比使用 NVIDIA GPU 慢得多。
如果您的云服务器或电脑已配备 NVIDIA 显卡 ,请运行 run_nvidia_gpu.bat 文件以使用 GPU 模式。双击启动后,等待几分钟,系统将自动下载并安装所需依赖。
脚本运行完成后,将自动打开 Stable Diffusion 的控制面板(Control Panel) 。此时,只需将之前在步骤 3 下载的 SD3.5L_example_workflow.json 文件拖拽到该界面中,即可快速加载示例工作流并开始使用。
在 TripleCLIPLoader 模块中,选择与之前下载的 clip 文件 名称相对应的选项。 至此,我们已经成功在本地(local host)完成 Stable Diffusion 的安装与配置!
4. Stable Diffusion 快速使用指南 在 CLIP Text Encode(Prompt) 区域输入您的提示词(Prompt)
此外,您还可以在 EmptySD3LatentImage 模块中调整一些参数,例如图像分辨率。
请注意:图像尺寸必须为 64 的倍数 。
填写完所有信息后,点击界面右侧的 Queue Prompt (或某些版本中显示为 Queue )按钮,即可开始生成图像。
稍等片刻,生成的图像将会显示在 Preview Image(预览图像) 区域。生成速度取决于您服务器的硬件配置。以 TotHost 的 RTX 5880 GPU 云服务器 为例,生成一张图像大约只需 约 28 秒。
可以看到,生成的效果相当出色——最令人惊喜的是,它 完全免费 , 不限生成次数与下载次数 !图像质量极为清晰细腻,堪称专业级水准。
VIDEO
5. 结论 以上内容为您详细介绍了如何选择合适的配置、在 Windows 系统的 GPU 云服务器 上安装与使用 Stable Diffusion 3.5 。 如果您希望获得一套 为 Stable Diffusion 3.5 预先优化的 GPU 云服务器方案 ,并享受快速支持与灵活扩展能力,欢迎选择 TotHost 的相关服务套餐,即刻开启您的 AI 创作之旅。
此外,若您希望进一步了解如何构建基于 AI 的自动化工作流,您还可以参考以下相关文章:
常见问题(FAQ) Q1:Stable Diffusion 3.5 与之前的 SDXL 有何区别? 3.5 版本在理解提示词(prompt)方面更出色,能够生成更自然的光影与人脸细节,同时由于采用优化后的混合式 Transformer 架构,运行速度提升约 30%。
Q2:在 VPS 上运行 SD 3.5 是否需要单独安装 CUDA 驱动? 需要。您需安装 NVIDIA CUDA Toolkit(版本 ≥12.1) 以及兼容的 cuDNN,以避免启动 ComfyUI 时出现报错。
Q3:是否可以在 SD 3.5 中使用旧版模型(如 SDXL 1.0 或 1.5)? 可以,但需确保 Checkpoint 与 VAE 格式正确匹配。部分旧模型可能需要先进行格式转换后再加载。
Q4:哪个软件最适合运行 SD 3.5? 目前 ComfyUI 是最优选择,支持 节点式工作流(Node Graph)、ControlNet、AnimateDiff 以及自定义 LoRA 模块。
Q5:如果我只想生成 1K–2K 分辨率图像,应选择哪款 GPU? RTX 4070(12GB) 或 RTX 4090(24GB) 是性价比最高的选择,可在批量大小(Batch Size)为 2–4 时流畅运行 SD 3.5。