ACE-Step est le modèle open source de génération musicale de ByteDance, combinant des transformateurs de diffusion avec une approche de correspondance de flux conditionnelle. Tout ce que vous devez savoir.
Dernière mise à jour : Février 2026
ACE-Step est un modèle open source de texte en musique publié par ByteDance en 2025. La version 1.5 a apporté des améliorations significatives en termes de clarté vocale, de cohérence rythmique et de cohérence multi-instruments. Le modèle utilise une architecture de transformateur de diffusion conditionnée sur des descriptions textuelles, supportant la génération jusqu'à 4 minutes.
ACE-Step utilise un Modèle de Diffusion Latente (LDM) opérant dans le domaine STFT (Transformée de Fourier à Court Terme). Contrairement aux modèles basés sur les formes d'onde, cette approche permet une synthèse audio de haute qualité à un coût computationnel réduit.
FM9 vous offre la génération musicale alimentée par le cloud — sans GPU, sans configuration, sans attendre l'installation des dépendances. Bien qu'ACE-Step soit remarquable pour les chercheurs et utilisateurs avancés souhaitant un contrôle total, FM9 offre des résultats instantanés aux créateurs qui veulent se concentrer sur la musique, pas l'infrastructure.
Générez de la musique IA professionnelle dans votre navigateur. 50 crédits bonus à l'inscription.
Commencer à Créer Gratuitement