Les musiciens sont-ils menacés ? Étrangement, alors qu'il était convenu pendant des années que l'intelligence artificielle ne serait pas adaptée à la création artistique, c'est justement dans ces domaines qu'elle nous étonne le plus ces derniers mois.
On a ainsi pu voir, en marge de ChatGPT, l'ascension de MidJourney, Stable Diffusion et d'autres IA proposer de la création visuelle avec des résultats impressionnants.
Une IA pour générer de la musique
Désormais, Meta se penche sur l'audio avec AudioCraft, une IA générative spécialisée dans la composition musicale.
AudioCraft se base sur 3 modèles d'IA différents pour, selon Meta, "générer facilement de l'audio et de la musique de haute qualité". Comme toujours il suffit de décrire textuellement son projet pour que l'IA l'analyse, l'interprête et ne propose un fichier audio. Pas besoin de jouer d'un instrument pour créer, l'IA se charge de tout...
L'IA de Meta se base tout d'abord sur MusicGen, une IA capable de créer une courte piste audio à partir d'une phrase en se basant sur une banque de 20 000h de musique sous licence. Il suffit d'indiquer le genre ou le style musical, de préciser quels instruments on souhaite et éventuellement d'ajouter les sentiments que la composition doit refléter.
En parallèle, AudioGen, une autre IA génère des effets sonores et bruitages qui sont intégrés à la piste pour renforcer certaines émotions ou effets. Enfin, c'est l'IA Encodec qui découpe les morceaux en petits segments pour mieux les travailler et les opérer des transitions plus douces, tout en supprimant les bruits indésirables ou sifflements générés.
L'idée n'est pas de remplacer les artistes, mais plutôt de fournir un outil accessible au grand public pour générer de l'audio venant appuyer un projet quelconque. On pourra ainsi personnaliser ses vidéos, obtenir des bruitages précis pour un court métrage, agrémenter plus facilement un logiciel en développement avec un environnement sonore sur mesure...
L'accès à AudioCraft est gratuit pour les chercheurs et tout est proposé en open source, tout comme c'est actuellement le cas avec LLaMA 2.