Is ACE-Step free to use?

Yes. ACE-Step is released under the Apache 2.0 license, meaning it's free for both personal and commercial use. You only pay for the compute costs of running it locally.

What GPU do I need to run ACE-Step?

ACE-Step 1.5 requires an NVIDIA GPU with at least 8GB VRAM for FP16 inference. A 24GB GPU (RTX 3090/4090) is recommended for comfortable use with longer generations.

How does ACE-Step 1.5 compare to the original?

ACE-Step 1.5 brought major improvements in vocal clarity, support for longer audio clips (up to 4 minutes), better rhythm consistency, and improved multi-track coherence compared to the initial release.

Can I use ACE-Step without a GPU?

Technically yes, using CPU-only mode, but generation times become impractical (30+ minutes per clip). FM9 offers cloud-based AI music generation as a more practical alternative.

開源 AI 音樂

ACE-Step 1.5：開源 AI 音樂模型

ACE-Step 是字節跳動發布的開源音樂生成基礎模型，結合了擴散變換器與條件流匹配方法。以下是你需要瞭解的一切。

最後更新：2026年2月

什麼是 ACE-Step？

ACE-Step 是字節跳動於 2025 年發布的開源文字轉音樂模型。1.5 版本在人聲清晰度、節奏一致性和多樂器協調性方面有了顯著提升。該模型使用以文字描述為條件的擴散變換器架構，支援最長 4 分鐘的音樂生成。

Apache 2.0 授權——可免費商用
可在 8GB+ 顯存的 NVIDIA GPU 上本地運行
支援歌詞到歌曲的生成
支援 LoRA 微調自訂風格

ACE-Step 的工作原理

ACE-Step 使用在 STFT（短時傅立葉變換）域中運行的潛在擴散模型（LDM）。與基於波形的模型不同，這種方法以更低的計算成本實現高品質音訊合成。架構結合了音樂 VAE 編解碼器與條件流匹配擴散變換器。

✓ 優勢

免費開源（Apache 2.0）
強大的歌詞融合和人聲品質
支援長形式生成（最長 4 分鐘）
活躍的社群和 LoRA 生態系統
無使用限制或浮水印

⚠ 限制

—需要 8GB+ 顯存的 NVIDIA GPU
—本地配置複雜，相依性管理繁瑣
—比雲端 API 慢（RTX 3090 上需 2-5 分鐘）
—無即時協作功能
—對冷門樂器支援有限

FM9 vs 本地 ACE-Step

FM9 為你提供雲端驅動的音樂生成——無需 GPU、無需配置、無需等待相依性安裝。雖然 ACE-Step 對於需要完全控制的研究人員和進階用戶非常出色，但 FM9 能為專注於音樂創作而非基礎設施的創作者提供即時結果。

FAQ

免費試用 FM9——無需任何配置

在瀏覽器中生成專業 AI 音樂。注冊即送 50 積分。

免費開始創作

ACE-Step 1.5：開源 AI 音樂模型

什麼是 ACE-Step？

ACE-Step 的工作原理

✓ 優勢

⚠ 限制

FM9 vs 本地 ACE-Step

深入瞭解

ACE-Step vs Suno

安裝指南

LoRA 訓練

FAQ

免費試用 FM9——無需任何配置