オープンソースAI音楽

ACE-Step 1.5:オープンソースAI音楽モデル

ACE-Stepは、ByteDanceがリリースしたオープンソースの音楽生成基盤モデルで、拡散トランスフォーマーと条件付きフローマッチングアプローチを組み合わせています。知っておくべきことをすべてご紹介します。

最終更新:2026年2月

ACE-Stepとは?

ACE-Stepは、ByteDanceが2025年にリリースしたオープンソースのテキスト→音楽モデルです。バージョン1.5では、ボーカルの明瞭度、リズムの一貫性、マルチ楽器のコヒーレンスが大幅に改善されました。このモデルは、テキスト記述を条件とする拡散トランスフォーマーアーキテクチャを使用し、最大4分の生成をサポートします。

  • Apache 2.0ライセンス——商用利用も無料
  • 8GB以上のVRAMを搭載したNVIDIA GPUでローカル実行可能
  • 歌詞から楽曲への生成に対応
  • カスタムスタイル向けLoRAファインチューニング対応

ACE-Stepの仕組み

ACE-Stepは、STFT(短時間フーリエ変換)ドメインで動作する潜在拡散モデル(LDM)を使用します。波形ベースのモデルとは異なり、このアプローチにより低い計算コストで高品質な音声合成が可能です。アーキテクチャは、音楽VAEエンコーダー-デコーダーと条件付きフローマッチング拡散トランスフォーマーを組み合わせています。

強み

  • 無料かつオープンソース(Apache 2.0)
  • 優れた歌詞統合とボーカル品質
  • 長尺生成をサポート(最大4分)
  • 活発なコミュニティとLoRAエコシステム
  • 使用制限や透かしなし

制限事項

  • 8GB以上のVRAMを搭載したNVIDIA GPUが必要
  • 複雑なローカルセットアップと依存関係の管理
  • クラウドAPIより遅い(RTX 3090で2〜5分)
  • リアルタイムコラボレーション機能なし
  • 珍しい楽器のサポートが限定的

FM9 vs ローカルACE-Step

FM9はクラウド駆動の音楽生成を提供します——GPUも、セットアップも、依存関係のインストール待ちも不要。ACE-Stepは完全な制御を望む研究者やパワーユーザーに優れていますが、FM9はインフラではなく音楽に集中したいクリエイターに即時の結果を提供します。

FAQ

FM9を無料で試す——セットアップ不要

ブラウザでプロのAI音楽を生成。サインアップで50クレジットボーナス。

無料で作成を開始