在Internet Explorer启用下载(Download)功能
在 VPS 上使用 Windows 操作系统时,最初您将无法通过 Internet Explorer 下载任何文件。 发生这种情况是因为该浏览器的 Download(下载文件) 功能未启用。本文将向您展示如何启用下载功能,以便您在使用服务器时可以下载软件。
04/09/2025
Đang Tải...
在当下生成式 AI 日益成为内容创作者与设计工作室的重要“武器”的背景下,Stable Diffusion 3.5 以更高的图像质量、更强的语义理解力和更快的生成速度脱颖而出。本文将指导您在 运行 Windows 系统的 GPU 云服务器(VPS) 上安装与使用 Stable Diffusion 3.5 —— 这是当您需要强大性能、可通过 RDP 远程工作、并希望获得灵活扩展能力而无需投入昂贵工作站时的理想选择。
Mục lục
Mục lục
Stable Diffusion 是由 Stability AI 开发的生成式人工智能(Generative AI)模型,能够根据文字描述(text-to-image)生成接近专业水准的图像。
其原理是通过“反向扩散(reverse diffusion)”的方式,从随机噪声(noise)中逐步还原出完整的图像,并根据用户输入的提示词(prompt)进行创作。
Stable Diffusion 的优势:
开源免费(Open Source): 完全免费,可安装在任何操作系统上(Windows、Linux、macOS、GPU 云服务器等)。
高度可定制: 支持添加模型、Checkpoint、LoRA、ControlNet、VAE,或通过 ComfyUI、AUTOMATIC1111 等界面构建自定义工作流。
无需联网: 若云服务器已安装完整模型,可实现 100% 离线运行。
庞大的开发者社区: 在 Civitai、Hugging Face、GitHub 等平台上有数十万模型与工作流资源可供下载与分享。
Stable Diffusion 3.5 是 Stability AI 于 2025 年中发布的最新一代图像生成式 AI 模型。
它是 Stable Diffusion 3 系列 的重大升级版本,拥有更高的图像质量、更强的稳定性以及卓越的语义理解能力。该版本采用了 融合 Transformer 与 Diffusion 的混合式 text-to-image 架构,在细节表现与生成一致性方面都有显著提升。

Stable Diffusion 3.5 的主要亮点:
更强的语义理解力: 能精准描绘复杂场景、光影与自然构图,比 SDXL 更贴近人类视觉逻辑。
更高的图像质量: 细节丰富、光线与色彩自然,效果接近 Midjourney v6。
完美兼容 ComfyUI: 支持节点图(Node Graph)、LoRA、ControlNet、T2I Adapter 与 AnimateDiff 等扩展。
针对 RTX GPU 优化: 在显存 ≥12GB 的 GPU(如 RTX 3060、4070、4090、A5000)上运行最为高效。
轻松扩展: 可灵活添加不同模型或 Checkpoint(如 sd3.5-large、sd3.5-medium、turbo)以提升生成速度与多样性。
注意: Stable Diffusion 3.5 对显存的要求高于 SDXL,因此如果您希望稳定生成 1024×1024 图像 或 AI 视频,建议选择 显存 ≥12GB 的 GPU。

步骤 1:连接到 Windows 云服务器(VPS)
对于 Windows 云服务器,请使用系统自带的 远程桌面连接(Remote Desktop Connection) 应用程序。打开后,输入服务器的 IP 地址、用户名和密码,即可远程登录到 VPS。

步骤 2:下载 ComfyUI
如果您之前在本地运行过旧版本的 Stable Diffusion,可能已经熟悉 AUTOMATIC1111 的界面。然而,现在 ComfyUI 更加适配并全面支持 Stable Diffusion 3.5(尤其是新架构模型 SD 3 与 SD 3.5)。事实上,Stable Diffusion 的开发公司 Stability AI 官方也推荐使用 ComfyUI 来运行 SD 3.5 完整版本。以下是详细的安装步骤说明:
首先,通过以下链接下载 ComfyUI,向下滚动页面,找到并点击相应的安装包进行下载。
ComfyUI_windows_portable_nvidia.7z

下载完成后,请将压缩包进行解压缩。需要注意的是:如果您的 GPU 云服务器运行的是 Windows 10,可能需要先安装 WinRAR 或其他解压工具,才能正常解压文件。大家可以通过以下链接下载 WinRAR 安装程序。
步骤 3:下载 Stable Diffusion 3.5
此处我们将下载当前最新的 Stable Diffusion 3.5(large 模型)。大家也可以根据自己的系统配置,选择合适的模型版本进行下载。
进入以下链接后,先登录或注册账号,然后填写您的企业信息(如果没有,可随意填写任意企业资料),并勾选同意 模型使用条款 以获取下载权限。

接着进入 “Files and versions” 页面,向下滚动查找并下载以下两个文件: SD3.5L_example_workflow.json 和 sd3.5_large.safetensors


步骤 4:下载 Clip 文件
请依次下载以下三个文件:
如果您的内存较小,可以选择安装 clip 模型 t5xxl_fp8_e4m3fn.safetensors 以替代 fp16 版本,从而降低资源占用。

如果您在打开链接时提示“无访问权限”,如上图所示,这通常是因为您之前仅提交并同意了 SD 3.5 large 版本的使用条款,而当前链接指向的是 SD 3.5 medium 版本的仓库。因此,您需要重新填写信息并再次确认该版本的使用条款后,才能获得下载权限。
请前往以下链接重新填写信息并提交申请:

然后重新进入前面的链接,按照正常方式下载那 3 个文件 即可。
之所以需要访问 SD 3.5 Medium 的仓库,是因为 SD 3.5 Large 与 SD 3.5 Medium 两个模型共用同一套 文本编码器(Text Encoder)文件,即:clip_g, clip_l, 和 t5xxl_fp16。不过,这三份文件仅在 SD 3.5 Medium 的仓库中单独提供下载,因此必须通过该页面获取。
步骤 5:开始安装 Stable Diffusion 3.5
请注意,这一步非常关键,务必严格按照以下指引操作,确保安装过程顺利完成。

在下载完所有必要文件后,打开之前已解压的 ComfyUI_windows_portable_nvidia 文件夹。请在 ComfyUI_windows_portable_nvidia 文件夹中,按照以下路径找到 checkpoints 目录:
ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\checkpoints
在此目录下,将之前下载的 sd3.5_large.safetensors 文件粘贴进去即可。

接着,进入以下路径中的 clip 文件夹。该文件夹与 checkpoints 位于同一个 models 目录下,因此只需返回上一级文件夹即可看到。
ComfyUI_windows_portable_nvidia\ComfyUI_windows_portable\ComfyUI\models\clip
然后,将在步骤 3 中下载的 3 个 clip 文件 粘贴到此文件夹中即可。

步骤 6:运行 ComfyUI 启动脚本
返回到 ComfyUI_windows_portable 文件夹,您会看到其中包含两个 .bat 启动脚本文件。

如果您的系统没有 NVIDIA 显卡,请运行 run_cpu.bat 文件以使用 CPU 模式启动。需要注意的是,使用 CPU 运行的速度会比使用 NVIDIA GPU 慢得多。

如果您的云服务器或电脑已配备 NVIDIA 显卡,请运行 run_nvidia_gpu.bat 文件以使用 GPU 模式。双击启动后,等待几分钟,系统将自动下载并安装所需依赖。

脚本运行完成后,将自动打开 Stable Diffusion 的控制面板(Control Panel)。此时,只需将之前在步骤 3 下载的 SD3.5L_example_workflow.json 文件拖拽到该界面中,即可快速加载示例工作流并开始使用。

在 TripleCLIPLoader 模块中,选择与之前下载的 clip 文件 名称相对应的选项。
至此,我们已经成功在本地(local host)完成 Stable Diffusion 的安装与配置!
在 CLIP Text Encode(Prompt) 区域输入您的提示词(Prompt)

此外,您还可以在 EmptySD3LatentImage 模块中调整一些参数,例如图像分辨率。
请注意:图像尺寸必须为 64 的倍数。

填写完所有信息后,点击界面右侧的 Queue Prompt(或某些版本中显示为 Queue)按钮,即可开始生成图像。

稍等片刻,生成的图像将会显示在 Preview Image(预览图像) 区域。生成速度取决于您服务器的硬件配置。以 TotHost 的 RTX 5880 GPU 云服务器 为例,生成一张图像大约只需 约 28 秒。

可以看到,生成的效果相当出色——最令人惊喜的是,它完全免费,不限生成次数与下载次数!图像质量极为清晰细腻,堪称专业级水准。
以上内容为您详细介绍了如何选择合适的配置、在 Windows 系统的 GPU 云服务器上安装与使用 Stable Diffusion 3.5。
如果您希望获得一套 为 Stable Diffusion 3.5 预先优化的 GPU 云服务器方案,并享受快速支持与灵活扩展能力,欢迎选择 TotHost 的相关服务套餐,即刻开启您的 AI 创作之旅。
此外,若您希望进一步了解如何构建基于 AI 的自动化工作流,您还可以参考以下相关文章:
Q1:Stable Diffusion 3.5 与之前的 SDXL 有何区别?
3.5 版本在理解提示词(prompt)方面更出色,能够生成更自然的光影与人脸细节,同时由于采用优化后的混合式 Transformer 架构,运行速度提升约 30%。
Q2:在 VPS 上运行 SD 3.5 是否需要单独安装 CUDA 驱动?
需要。您需安装 NVIDIA CUDA Toolkit(版本 ≥12.1) 以及兼容的 cuDNN,以避免启动 ComfyUI 时出现报错。
Q3:是否可以在 SD 3.5 中使用旧版模型(如 SDXL 1.0 或 1.5)?
可以,但需确保 Checkpoint 与 VAE 格式正确匹配。部分旧模型可能需要先进行格式转换后再加载。
Q4:哪个软件最适合运行 SD 3.5?
目前 ComfyUI 是最优选择,支持 节点式工作流(Node Graph)、ControlNet、AnimateDiff 以及自定义 LoRA 模块。
Q5:如果我只想生成 1K–2K 分辨率图像,应选择哪款 GPU?
RTX 4070(12GB) 或 RTX 4090(24GB) 是性价比最高的选择,可在批量大小(Batch Size)为 2–4 时流畅运行 SD 3.5。