IA : quoi de neuf pour l’image et la vidéo ?
DES IMAGES TOUJOURS PLUS RÉALISTES
Depuis quelques mois, les images générées par IA ont franchi un véritable cap. Des outils comme Midjourney, Stable Diffusion ou encore DALL-E 3 d’OpenAI produisent désormais des visuels ultra réalistes, parfois bluffants de précision tant ils sont hyperréalistes.
Les images générées avec Midjourney v7 détonnent de détails et de réalisme avec un rendu photographique.
LA VIDÉO : LE PROCHAIN GRAND SAUT
Si l’IA est déjà très à l’aise pour créer des images fixes, la vidéo représente le prochain grand défi technologique. Plusieurs acteurs comme Runway ou Pika Labs proposent déjà des outils capables de produire des vidéos courtes générées entièrement par IA. Si les résultats restent perfectibles, les progrès sont aussi impressionnants que rapides. Runway a justement dévoilé sa 4ème Génération – Gen-4 – il y a tout juste une semaine. Si leur vidéo de lancement est destinée à un public de professionnels de l’image, elle offre à tous d’apprécier les capacités incroyables de l’outil en termes de personnalisation et donc de contrôle. Notre conviction se renforce à chaque nouvelle étape franchie par l’IA pour la création de vidéos. La première plateforme qui parviendra à proposer une interface à la fois complète et intuitive coiffera assurément au poteau tous ses concurrents. Le déploiement depuis peu de Sora en France – l’IA dédiée à la création vidéo d’OpenAI – promet également de démocratiser l’outil, tandis que des acteurs inattendus font leur entrée en scène. C’est le cas de la plateforme Freepik, un pionnier de la banque image gratuite, qui pourrait devenir rapidement incontournable en agrégeant un ensemble d’outils pour proposer un écosystème et un workflow très complet.Des questions et des limites
Évidemment, ces avancées posent aussi des questions importantes. D’abord éthiques : comment gérer la frontière entre créativité et réalité ? Comment veiller garantir la transparence sur l’origine des contenus générés par IA ? Et donc comment s’assurer que des artistes ne soient plagiés à l’envie sans percevoir de droits d’auteur ? L’actu toujours, nous en a offert récemment une parfaite illustration lorsque les serveurs de ChatGPT 4.0 ont littéralement surchauffé pour répondre à la demande de création d’images dans le style du Studio Ghibli, au grand dam de son fondateur et mangaka Hayao Miyazaki. Ensuite ces limites sont également techniques : les ressources informatiques nécessaires sont énormes. Quand on sait que de mini centrales nucléaires sont à l’étude pour alimenter les data centers, on appréhende mieux l’échelle des besoins en énergie. On se questionne également sur la sécurité de telles installations : qui, quoi et comment ? Quant aux limites intrinsèques de l’outil, on s’est prêté à un test pour mieux vous en parler : une vidéo très librement inspirée du tableau Nighthawks d’Edward Hopper et générée avec l’outil Kling. On apprécie particulièrement sa fonction « Extend » qui permet de compléter un plan original étape après étape. En théorie tout du moins. On vous laisse visionner, cette démonstration illustre bien les défis actuels de la vidéo générée par IA. Si le sujet vous intéresse, on vous en parle plus en détail dans cet article dédié aux limites et enjeux de la production vidéo IA. … Le constat est sans appel : à chaque palier de 5 secondes, l’IA ne parvient pas à poursuivre la scène avec 100% de fidélité. Ça débute par la gestion des lumières et des couleurs et, bien plus déroutant : un personnage change de sexe tandis qu’un autre disparait. Mine de rien, ce test fournit un exemple très concret des capacités mais aussi des limites actuelles de l’IA pour la génération de vidéos. Et du bond qu’il lui reste encore à réaliser pour travailler des séquences sur la durée. Plus encore avec des outils fréquemment limiter à la génération de plans de seulement 5 secondes. On se garde sous le coudes nos prompts pour les tester à nouveau dans quelques mois sur le même outil et juger des progrès réalisés dans l’interval. Mais ces défis ne freinent pas l’élan créatif autour de l’IA générative. Au contraire, ils poussent à innover encore davantage, pour trouver des solutions et encadrer intelligemment ces nouvelles technologies.Alors prêts pour l’avenir ?
Une chose est sûre, l’IA générative va continuer de transformer profondément le paysage créatif visuel. Et ce n’est que le début ! Restez connectés : les prochains mois promettent de nous réserver encore bien des surprises.t
Technicien vidéo autodidacte et passionné de stratégie de marques et de communication, j’ai la chance de marier ces 2 marottes au sein de l’équipe EO Production. Plus particulièrement tourné vers la rédaction, j’interviens en amont des projet sur les recommandations stratégiques et notes d’intention.
