Can I run ACE-Step on a MacBook?

Yes, but with limitations. ACE-Step supports Apple Silicon (M1/M2/M3) via MPS backend, but generation is significantly slower than NVIDIA CUDA. A MacBook Pro M3 Max takes ~3-4 minutes per 30-second clip.

What CUDA version does ACE-Step require?

ACE-Step 1.5 supports CUDA 11.8 and 12.1. Check your driver version with nvidia-smi and install the matching PyTorch build.

Why is ACE-Step generation so slow on my machine?

Generation speed depends heavily on GPU VRAM and compute. A 4080 generates 30-sec clips in ~45 seconds. If you're on a 3060 (12GB), expect 2-3 minutes. CPU-only mode is impractical for regular use.

Install Guide

如何在本地安装 ACE-Step

Windows、macOS 和 Linux 的完整安装指南——包括最常见错误的排查方法。

最后更新：2026年2月

系统要求

Component	Minimum	Recommended
GPU	NVIDIA RTX 2080 (8GB VRAM)	NVIDIA RTX 3090/4090 (24GB VRAM)
CPU	Intel i7-8700 / AMD Ryzen 7 3700X	Intel i9-12900K / AMD Ryzen 9 5900X
RAM	16GB DDR4	32GB+ DDR4
Storage	20GB SSD	50GB+ NVMe SSD
CUDA Version	11.8	12.1
Python	3.9	3.10 or 3.11
OS	Windows 10, macOS 12, Ubuntu 20.04	Ubuntu 22.04 LTS (best performance)

安装步骤

1
安装 Conda 或 Miniconda
从 conda.io 下载并安装 Miniconda。这用于管理你的 Python 环境并防止依赖冲突。
2
克隆代码仓库
运行：git clone https://github.com/ace-step/ACE-Step.git && cd ACE-Step
```
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
```
3
创建 Conda 环境
运行：conda env create -f environment.yml && conda activate ace-step
```
conda env create -f environment.yml
conda activate ace-step
```

安装带 CUDA 的 PyTorch

对于 CUDA 11.8：pip install torch==2.0.1+cu118 -f https://download.pytorch.org/whl/cu118/torch_stable.html

pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio==2.0.2+cu118 \
  -f https://download.pytorch.org/whl/cu118/torch_stable.html

5
下载模型权重
运行：python download_models.py，从 HuggingFace 获取约 15GB 的模型检查点。
```
python download_models.py
```
6
启动 Web UI
运行：python app.py，在 http://localhost:7860 启动 Gradio Web 界面。
```
python app.py
```

性能优化

为获得更快的生成速度，在支持的 GPU 上使用 FP16 精度（--fp16 标志）。通过安装 xformers 启用 xFormers 注意力机制，可提速 30-40%。对于 12GB 以下显存的 GPU，请始终使用 8 位量化。

pip install xformers
python app.py --fp16

常见问题与解决方法

内存不足（OOM）错误

如果遇到 CUDA OOM 错误，尝试通过在启动命令中添加 --quantize int8 来启用 8 位量化。或者，使用 --cpu-offload 启用 CPU 卸载，将部分层移至系统内存。

python app.py --quantize int8
# or
python app.py --cpu-offload --fp16

依赖冲突

ACE-Step 需要特定版本的 PyTorch 和 CUDA。请始终使用提供的 conda 环境文件或 requirements.txt。混合使用 pip 和 conda 安装经常导致冲突。

端口已被占用

如果端口 7860 繁忙，在 Gradio 启动命令中添加 --port 7861（或任何可用端口）。

python app.py --port 7861

找不到模型路径

确保磁盘空间充足（模型权重约 15GB）。从项目根目录（而非子目录）运行下载脚本。

FAQ

完全跳过配置

不喜欢终端命令和依赖地狱？FM9 在浏览器中为你提供云端驱动的 ACE-Step 兼容音乐生成。无需 GPU，无需配置，无需等待。

免费开始创作

如何在本地安装 ACE-Step

系统要求

安装步骤

安装 Conda 或 Miniconda

克隆代码仓库

创建 Conda 环境

安装带 CUDA 的 PyTorch

下载模型权重

启动 Web UI

性能优化

常见问题与解决方法

内存不足（OOM）错误

依赖冲突

端口已被占用

找不到模型路径

FAQ

完全跳过配置

相关文章

ACE-Step Overview

ACE-Step vs Suno

LoRA Training