ACE-Step é o modelo de geração musical open source da ByteDance — combinando transformadores de difusão com uma abordagem de correspondência de fluxo condicional. Tudo o que você precisa saber.
Última atualização: Fevereiro 2026
ACE-Step é um modelo open source de texto para música lançado pela ByteDance em 2025. A versão 1.5 introduziu melhorias significativas na clareza vocal, consistência rítmica e coerência multi-instrumento. O modelo usa uma arquitetura de transformador de difusão condicionada em descrições de texto, suportando geração de até 4 minutos.
ACE-Step usa um Modelo de Difusão Latente (LDM) operando no domínio STFT (Transformada de Fourier de Curto Prazo). Ao contrário dos modelos baseados em forma de onda, esta abordagem permite síntese de áudio de alta qualidade a um custo computacional reduzido.
FM9 oferece geração musical alimentada pela nuvem — sem GPU, sem configuração, sem esperar dependências instalarem. Enquanto ACE-Step é notável para pesquisadores e power users que querem controle total, FM9 entrega resultados instantâneos para criadores que querem focar na música, não na infraestrutura.
Gere música IA profissional no seu navegador. 50 créditos bônus no cadastro.
Começar a Criar Gratuitamente