Jukebox est une IA qui transforme des paroles en musique

IA

Une fois n’est pas coutume : voilà un autre article que nous consacrons à la rencontre de l’IA et de la création musicale. Après le projet “Kórsafn” de Björk ou le morceau de Travis Scott jusqu’à MatchTune la startup d’André Manoukian et Philippe Guillaud, c’est le projet de OpenAI qui a piqué notre curiosité.

OpenAI a développé ce système d’intelligence artificielle ou IA reposant sur du machine learning à même de créer une musique à partir de presque rien. Ce presque rien, ce sont des paroles entendues dans un morceau. Mais Jukebox n’est pas le coup d’essai d’OpenAI. Récemment, l’entreprise introduisait MuseNet, l’ancêtre de Jukebox. Un système d’intelligence artificielle également capable de produire des sons sur demande mais pas que. MuseNet était également d’appréhender un morceau de musique en entier et de l’assimiler.

Dans un second temps, l’IA était alors en mesure de prédire une chanson avant même de l’entendre.

L’IA : l’avenir de la création musicale ?

En ce sens, Jukebox n’est que le successeur de MuseNet mais au lieu de reconnaître un morceau, ce système est capable d’en composer un de toute pièce. La prouesse ne s’arrête pas là : l’IA choisit elle même les instruments, genres musicaux et même.. les paroles. Il lui suffit d’ailleurs de 12 secondes d’un morceau pour pouvoir composer elle-même le reste.

La technologie Jukebox par OpenAI

Sur ce dernier point, elle n’est pas prête de renverser les paroliers humains mais la science progresse. Pour l’heure, Jukebox ne peut pas appréhender et assimiler des paroles. Pour le reste du processus de composition, l’IA mélange elle-même différentes séquences de morceaux qu’elle a déjà assimilé.

Pourtant, elle comprend le texte d’où elle tire sa mélodie, ce qui lui permet ensuite d’harmoniser l’ensemble du morceau ainsi produit. Précisons que pour les besoins de son développement, l’IA a écouté et assimilé l’équivalent de 1,2 millions de morceaux. C’est cette vaste « culture musicale » qui lui permet d’improviser. Comme elle semble faire improviser des impresarios virtuels exploitant la voix d’icônes de la musique dont Elvis Presley.

Jack Park Canny Dope Man par Travis Scott

Même si cette solution n’a pas encore séduit de musiciens de métier, les applications sont multiples. Notamment pour des expériences nécessitant une improvisation en continu. L’IA est de toute façon amenée à se démocratiser dans la création musicale. On pensera notamment au morceau de Travis Scott : Jack Park Canny Dope Man.

Inscrivez-vous à la newsletter vokode

Recevez chaque semaine le meilleur de l’actualité à propos des assistants vocaux et des innovations liées à l’audio digital. 

Les articles similaires

revue de presse vocal expérience client

Le Moulin à Paroles #55

Le Moulin à Paroles : la revue de presse par l’équipe Vokode. Nous vous proposons une sélection d’articles sur les technologies vocales. Cette semaine, nous nous intéressons notamment à

Lire plus »