La nouvelle IA de DeepMind génère des bandes sonores et des dialogues pour les vidéos

DeepMind, le laboratoire de recherche en IA de Google, affirme qu'il développe une technologie d'IA pour générer des bandes sonores pour les vidéos.

Dans un article sur son blog officiel, DeepMind explique qu'il voit la technologie, V2A (abrégé de 'vidéo-vers-audio'), comme un élément essentiel du puzzle des médias générés par l'IA. Alors que de nombreuses organisations, y compris DeepMind, ont développé des modèles d'IA générant des vidéos, ces modèles ne peuvent pas créer d'effets sonores synchronisés avec les vidéos qu'ils génèrent.

...

DeepMind présente sa technologie V2A comme un outil particulièrement utile pour les archivistes et les personnes travaillant avec des images historiques. Mais l'IA générative de ce type menace également de bouleverser l'industrie du cinéma et de la télévision. Il faudra des protections du travail sérieusement solides pour veiller à ce que les outils de médias génératifs ne suppriment pas d'emplois - ou, comme c'est le cas, des professions entières.