un essai d’intelligence artificielle pour recréer le tout premier film de l’histoire, mais le résultat n’est pas à la hauteur des attentes

Publié le 13 avril 2025 à 09h10
modifié le 13 avril 2025 à 09h10
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

Remettre en question les capacités de l’intelligence artificielle s’avère nécessaire, notamment lorsqu’il s’agit de recréer un chef-d’œuvre. Les tentatives de reproduction de « L’Arroseur arrosé », le tout premier film de l’histoire, posent des interrogations fondamentales. L’enjeu dépasse la simple reproduction technique ; il engage une réflexion sur l’essence même du cinéma et de la création artistique. Les avancées technologiques, bien qu’impressionnantes, échouent à saisir la quintessence d’une œuvre emblématique. Le résultat de ces efforts renvoie une image d’incohérence et de déception, illustrant ainsi les limites actuelles de l’IA dans le domaine cinématographique.

Un essai ambitieux dans la génération vidéo par intelligence artificielle

Le défi ultime a été lancé : reproduire « L’Arroseur arrosé », le premier film de fiction. Ce chef-d’œuvre, réalisé par Louis Lumière en 1895, a été la cible d’une série de tests par des modèles d’intelligence artificielle, tels que Sora d’OpenAI, Gen-4 de Runway, Veo-2 de Google et Kling de Kuaishou. L’objectif consistait à déterminer si l’IA pourrait créer des séquences aussi fluides et comiques que l’œuvre originale.

Décomposition des séquences originales

Pour mieux atteindre l’objectif, le film a été segmenté en quatre séquences majeures. Chaque scène devait capturer des moments clés : le jardinier arrosant son jardin, le garçon empêchant l’eau de s’écouler, le retour impulsif de l’eau sur le jardinier, et enfin, la tentative de capture du garçon par ce dernier. Chaque segment recèle un potentiel comique, élément central de la première fiction filmée.

Premières tentatives avec Sora d’OpenAI

La première approche s’est appuyée sur le modèle classique text-to-video de Sora. Les résultats, cependant, se sont révélés déconcertants. Les séquences apparaissaient totalement hors contexte, décevant les attentes initiales. Cherchant une solution, les chercheurs ont opté pour l’image-to-video avec Sora, fournissant ainsi aux modèles des images fixes pour une meilleure cohérence. Malheureusement, cette méthode n’a pas abouti à des rendus satisfaisants non plus.

Colorisation assistée par IA

Confrontés à des résultats insatisfaisants, les expérimentateurs ont eu recours à des captures du film original. Ces images ont ensuite été colorisées grâce à Gemini Flash 2.0 Exp de Google, assurant une fidélité esthétique supérieure. Les colorisations ont produit des scènes vibrantes, rappelant celles qu’un véritable tournage aurait pu offrir.

Exploration avec Gen-4 de Runway

Renouvelant leurs efforts, les chercheurs ont changé de modèle, se tournant vers Gen-4 de Runway. En utilisant les images colorisées comme point de départ, ils ont tenté d’engendrer des séquences. Malgré un résultat légèrement plus pertinent, les tentatives ont été jugées largement inférieures aux attentes. Une seconde séquence, par exemple, était si éloignée de la vision attendue qu’elle a suscité la désillusion.

Utilisation de Veo-2 de Google DeepMind

Veo-2, dernier né de Google DeepMind, a été introduit pour essayer d’améliorer la situation. Ce modèle a permis des généralisations plus fidèles, établissant une cohérence spatio-temporelle plus vertueuse. Les séquences donnaient une impression de vie réelle, bien que des soucis de continuité restaient à déplorer, notamment au niveau des visages et des costumes des personnages.

Résultat et évaluation finale

La dernière phase a intégré la révision des images produites par Gemini, en cherchant à les affiner. Chaque séquence a été soumise au modèle Kling 2.6 de Kuaishou, espérant une convergence entre esthétisme et respect de l’œuvre originale. Les résultats se sont révélés plus photoréalistes, mais peu convaincants quant à la narration. Les changements entre les séquences demeuraient trop marqués, remettant en question la continuité de l’histoire.

Malgré des heures de travail acharné, le verdict s’est imposé : reproduire des films, même le tout premier, reste une tâche complexe pour les intelligences artificielles contemporaines. Ces tentatives mettent en lumière les limites actuelles de l’IA vidéo, alors que son potentiel semble vaste mais encore embryonnaire. Les chercheurs, armés de résilience, poursuivent pourtant leurs explorations, espérant voir l’IA atteindre de nouveaux sommets.

FAQ sur l’utilisation de l’intelligence artificielle pour recréer le premier film historique

Pourquoi l’intelligence artificielle n’a-t-elle pas réussi à recréer « L’Arroseur arrosé » de manière satisfaisante ?
Les avancées de l’intelligence artificielle en matière de génération vidéo sont encore en phase expérimentale. Les modèles testés ont rencontré des difficultés pour capturer la cohérence narrative et visuelle des séquences, entraînant un résultat final éloigné des attentes.

Quels modèles d’intelligence artificielle ont été utilisés dans cet essai ?
Des modèles tels que Sora d’OpenAI, Gen-4 de Runway, Veo-2 de Google, et Kling de Kuaishou ont été testés pour tenter de générer la vidéo.

Quelles étaient les principales limitations des modèles AI utilisés ?
Les principaux problèmes rencontrés incluaient l’incohérence dans les détails automatiques, comme des changements d’apparence des personnages et des actions mal interprétées, rendant les séquences difficiles à suivre.

Comment avez-vous préparé les séquences pour l’essai de génération vidéo ?
Les séquences du film original ont été découpées en quatre parties principales, avec une attention particulière portée à la description de chaque action, afin de fournir aux modèles AI des points de référence clairs.

Quel type d’images a été utilisé pour alimenter les modèles d’IA ?
Des images générées par d’autres modèles AI et des captures du film original colorisées ont été utilisées comme base visuelle pour chaque séquence afin d’améliorer la cohérence des résultats.

Quelle a été l’approche la plus prometteuse lors des essais ?
La méthode avec Veo-2 s’est révélée la plus prometteuse, parvenant à générer des séquences relativement cohérentes, bien que les résultats restaient largement en deçà des attentes.

Pourquoi l’utilisation de l’IA pour recréer ce film est-elle considérée comme « trichée » ?
Des mentions de l’utilisation de captures d’images du film original et de leur colorisation ont été utilisées, ce qui pourrait être perçu comme de la triche puisqu’il ne s’agit pas d’une création entièrement originale basée sur l’intelligence artificielle.

Quelles leçons ont été tirées de cet essai d’intelligence artificielle ?
Il a été observé que, malgré les progrès réalisés, l’IA générative vidéo n’est pas encore prête à reproduire des films historiques avec la précision nécessaire, soulignant la nécessité de davantage de développements dans le domaine.

Est-il possible d’attendre de meilleurs résultats avec l’évolution de l’IA vidéo ?
Oui, il est fort probable que les modèles d’intelligence artificielle continueront à s’améliorer, offrant potentiellement de meilleures capacités de création vidéo dans le futur.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsun essai d'intelligence artificielle pour recréer le tout premier film de l'histoire,...

Former les LLM à s’auto-détoxifier de leurs langages

découvrez comment former des modèles de langage de grande taille (llm) à s'auto-détoxifier, améliorant ainsi leur compréhension et leur utilisation du langage tout en réduisant les biais et en favorisant une communication plus éthique et responsable.

Nvidia va établir une usine de fabrication de superordinateurs dédiés à l’IA à Houston

découvrez comment nvidia va transformer le paysage technologique avec l'établissement d'une nouvelle usine à houston, dédiée à la fabrication de superordinateurs pour l'intelligence artificielle. un projet ambitieux qui promet d'accélérer l'innovation et le développement de l'ia.

Nvidia collabore avec ses partenaires pour développer des supercalculateurs d’IA aux États-Unis

découvrez comment nvidia s'associe avec ses partenaires pour créer des supercalculateurs d'intelligence artificielle aux états-unis, une innovation qui promet de transformer le paysage technologique et de propulser la recherche en ia vers de nouveaux sommets.

OpenAI va introduire des vérifications d’identité pour certains utilisateurs

découvrez comment openai mettra en place des vérifications d'identité pour certains utilisateurs, visant à renforcer la sécurité et à garantir une utilisation éthique de ses technologies. renseignez-vous sur les implications de cette nouvelle mesure et son impact sur votre expérience.

Siri se prépare à transformer vos photos : Apple fait un pas audacieux vers l’intelligence artificielle

découvrez comment apple, avec siri, transforme vos photos grâce à une avancée audacieuse dans le domaine de l'intelligence artificielle. plongez dans les innovations qui promettent de révolutionner votre expérience photographique.

Ghibli à l’ère de l’IA : quand la magie du studio s’exprime à travers les algorithmes

découvrez comment le célèbre studio ghibli fusionne sa magie intemporelle avec les technologies de l'intelligence artificielle. cet article explore l'impact des algorithmes sur l'univers enchanteur de ghibli, révélant une nouvelle dimension artistique fascinante.