IA : quoi de neuf pour l’image et la vidéo ?

L’actualité de l’IA générative ne ralentit pas — bien au contraire. Ce 8 avril marque une nouvelle étape avec le lancement officiel de Midjourney v7 en France, une version encore plus puissante, plus fluide et surtout plus réaliste. Dans un paysage où l’image et la vidéo générées par IA évoluent à vitesse grand V, difficile de suivre toutes les annonces sans y consacrer ses journées. On fait le tri pour vous : dans cet article, on passe en revue les dernières avancées majeures côté image et vidéo, les outils à suivre, et ce que ça change concrètement pour les créatifs, les agences et les marques. Pas de blabla, que du concret. Let’s go !

DES IMAGES TOUJOURS PLUS RÉALISTES

Depuis quelques mois, les images générées par IA ont franchi un véritable cap. Des outils comme Midjourney, Stable Diffusion ou encore DALL-E 3 d’OpenAI produisent désormais des visuels ultra réalistes, parfois bluffants de précision tant ils sont hyperréalistes.

Les images générées avec Midjourney v7 détonnent de détails et de réalisme avec un rendu photographique.

Le secret ? Une meilleure compréhension des prompts, des algorithmes plus puissants et surtout, une gestion affinée des détails et textures. Le résultat ? Des créatifs, designers et agences de com’ se régalent : création rapide de visuels, exploration de concepts graphiques sans limite ou encore personnalisation poussée, l’IA est devenue une alliée indispensable, une reine sur l’échiquier. Que ce soit en phase d’intention créative ou de production, elle fournit une boîte à outils aussi essentielles que notre parc caméras.

LA VIDÉO : LE PROCHAIN GRAND SAUT

Si l’IA est déjà très à l’aise pour créer des images fixes, la vidéo représente le prochain grand défi technologique. Plusieurs acteurs comme Runway ou Pika Labs proposent déjà des outils capables de produire des vidéos courtes générées entièrement par IA. Si les résultats restent perfectibles, les progrès sont aussi impressionnants que rapides. Runway a justement dévoilé sa 4ème Génération – Gen-4 – il y a tout juste une semaine. Si leur vidéo de lancement est destinée à un public de professionnels de l’image, elle offre à tous d’apprécier les capacités incroyables de l’outil en termes de personnalisation et donc de contrôle. Notre conviction se renforce à chaque nouvelle étape franchie par l’IA pour la création de vidéos. La première plateforme qui parviendra à proposer une interface à la fois complète et intuitive coiffera assurément au poteau tous ses concurrents.
Le déploiement depuis peu de Sora en France – l’IA dédiée à la création vidéo d’OpenAI – promet également de démocratiser l’outil, tandis que des acteurs inattendus font leur entrée en scène. C’est le cas de la plateforme Freepik, un pionnier de la banque image gratuite, qui pourrait devenir rapidement incontournable en agrégeant un ensemble d’outils pour proposer un écosystème et un workflow très complet.

Des questions et des limites

Évidemment, ces avancées posent aussi des questions importantes. D’abord éthiques : comment gérer la frontière entre créativité et réalité ? Comment veiller garantir la transparence sur l’origine des contenus générés par IA ? Et donc comment s’assurer que des artistes ne soient plagiés à l’envie sans percevoir de droits d’auteur ? L’actu toujours, nous en a offert récemment une parfaite illustration lorsque les serveurs de ChatGPT 4.0 ont littéralement surchauffé pour répondre à la demande de création d’images dans le style du Studio Ghibli, au grand dam de son fondateur et mangaka Hayao Miyazaki. Ensuite ces limites sont également techniques : les ressources informatiques nécessaires sont énormes. Quand on sait que de mini centrales nucléaires sont à l’étude pour alimenter les data centers, on appréhende mieux l’échelle des besoins en énergie. On se questionne également sur la sécurité de telles installations : qui, quoi et comment ? Quant aux limites intrinsèques de l’outil, on s’est prêté à un test pour mieux vous en parler : une vidéo très librement inspirée du tableau Nighthawks d’Edward Hopper et générée avec l’outil Kling. On apprécie particulièrement sa fonction « Extend » qui permet de compléter un plan original étape après étape. En théorie tout du moins. On vous laisse visionner, cette démonstration illustre bien les défis actuels de la vidéo générée par IA. Si le sujet vous intéresse, on vous en parle plus en détail dans cet article dédié aux limites et enjeux de la production vidéo IA. …
Le constat est sans appel : à chaque palier de 5 secondes, l’IA ne parvient pas à poursuivre la scène avec 100% de fidélité. Ça débute par la gestion des lumières et des couleurs et, bien plus déroutant : un personnage change de sexe tandis qu’un autre disparait. Mine de rien, ce test fournit un exemple très concret des capacités mais aussi des limites actuelles de l’IA pour la génération de vidéos. Et du bond qu’il lui reste encore à réaliser pour travailler des séquences sur la durée. Plus encore avec des outils fréquemment limiter à la génération de plans de seulement 5 secondes. On se garde sous le coudes nos prompts pour les tester à  nouveau dans quelques mois sur le même outil et juger des progrès réalisés dans l’interval. Mais ces défis ne freinent pas l’élan créatif autour de l’IA générative. Au contraire, ils poussent à innover encore davantage, pour trouver des solutions et encadrer intelligemment ces nouvelles technologies.

Alors prêts pour l’avenir ?

Une chose est sûre, l’IA générative va continuer de transformer profondément le paysage créatif visuel. Et ce n’est que le début ! Restez connectés : les prochains mois promettent de nous réserver encore bien des surprises.t