ACE-Step은 ByteDance가 출시한 오픈소스 음악 생성 기반 모델로, 확산 트랜스포머와 조건부 플로우 매칭 방식을 결합합니다. 알아야 할 모든 것을 소개합니다.
최종 업데이트: 2026년 2월
ACE-Step은 ByteDance가 2025년에 출시한 오픈소스 텍스트-투-뮤직 모델입니다. 버전 1.5는 보컬 명료도, 리듬 일관성, 멀티 악기 코히어런스가 크게 향상되었습니다. 이 모델은 텍스트 설명을 조건으로 하는 확산 트랜스포머 아키텍처를 사용하며 최대 4분 생성을 지원합니다.
ACE-Step은 STFT(단시간 푸리에 변환) 도메인에서 작동하는 잠재 확산 모델(LDM)을 사용합니다. 파형 기반 모델과 달리 이 접근 방식은 낮은 계산 비용으로 고품질 오디오 합성을 가능하게 합니다.
FM9은 클라우드 기반 음악 생성을 제공합니다 — GPU 불필요, 설정 불필요, 종속성 설치 대기 불필요. ACE-Step은 완전한 제어를 원하는 연구자와 파워 유저에게 탁월하지만, FM9은 인프라가 아닌 음악에 집중하고 싶은 크리에이터에게 즉각적인 결과를 제공합니다.