Création de vidéos : Veo de Google fait son entrée dans l’univers de Vertex AI

Publié le 3 décembre 2024 à 16h03
modifié le 3 décembre 2024 à 16h03
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

L’innovation technologique se manifeste avec éclat grâce à l’arrivée de Veo, la solution vidéo par IA proposée par Google. Ce nouvel outil redéfinit le paysage visuel en offrant des créations audiovisuelles d’une qualité inégalée. L’intégration de Veo au sein de Vertex AI souligne l’engagement continu de Google dans la sphère de l’intelligence artificielle.
Ce modèle révolutionnaire, capable de générer des vidéos en résolution 1080p, pose la question de l’avenir de la créativité numérique. La fonction image-to-video est particulièrement prometteuse, propulsant Google en leader parmi les grands de l’industrie. La cohérence visuelle et la finesse des détails sont les clefs de cette avancée notable, marquant un tournant majeur dans l’IA générative.

Veo : Une nouvelle ère pour la création vidéo par IA

Google Cloud a récemment lancé Veo, un nouvel outil de génération de vidéos par intelligence artificielle, se positionnant ainsi comme un challengerdirect à l’outil Sora d’OpenAI. En phase de preview privée, ce dispositif novateur intègre les capacités de Vertex AI pour révolutionner la production de contenu vidéo.

Caractéristiques techniques de Veo

Veo se distingue par sa faculté à générer des vidéos de haute résolution, atteignant 1080p, avec une durée dépassant la minute et une cadence de 24 ou 30 images par seconde. Ce modèle novateur excelle dans la transformation de textes en vidéos (text-to-video) ainsi que dans la conversion d’images en séquences animées (image-to-video). Ces fonctionnalités placent Google Cloud en tête des hyperscalers, offrant un ensemble d’outils unique.

Stabilité et cohérence visuelle

L’architecture employée par Google repose sur un système de transformers à diffusion latente. Cette technologie permet de garantir une cohérence visuelle inédite au sein des séquences générées. Les personnages, objets et styles demeurent stables d’une image à l’autre, ce qui minimise les artefacts visuels perturbants. Ainsi, l’expérience de visionnage s’améliore considérablement.

Un timing stratégique

Le lancement de Veo intervient à un moment où Amazon expose ses innovations en intelligence artificielle générative lors de la conférence AWS Re:Invent. Cette coïncidence favorise la réaffirmation de la position de Google dans la compétition féroce autour de l’IA générative vidéo.

Exemples de création avec Veo

Google a dévoilé plusieurs vidéos élaborées sur Veo, illustrant ses capacités impressionnantes. Parmi les exemples figurent des séquences captivantes, telles qu’un ours jouant de la guitare, une foule en liesse lors d’un concert électro, et un voilier défiant des vagues tumultueuses. Ces démonstrations mettent en avant la stabilité remarquable des résultats générés.

Effets cinématographiques et potentialités professionnelles

Veo se distingue également par sa maîtrise d’effets cinématographiques complexes, tels que le time-lapse et les mouvements de caméra. Ce potentiel d’utilisation s’avère particulièrement pertinent dans un contexte professionnel, où la qualité visuelle est primordiale.

Qualité de la vidéo générée

La qualité des vidéos résultant d’une simple image s’annonce aussi impressionnante. Les utilisateurs peuvent s’attendre à des résultats d’une clarté exceptionnelle, ouvrant ainsi la voie à de nombreuses applications créatives.

Accessibilité et évaluation des capacités

À l’instar de Sora, Veo demeure pour l’instant inaccessible au grand public. Le Journal du Numérique n’a pas pu tester le modèle en raison de cette limitation. Cette absence de test direct rend difficile l’évaluation précise de ses véritables capacités et de ses limites.

Foire aux questions sur Veo de Google et Vertex AI

Qu’est-ce que Veo et quelle est sa principale fonctionnalité ?
Veo est un générateur de vidéos par IA développé par Google, capable de créer des vidéos en 1080p à partir de textes, d’images et d’invites vidéo.
Comment Veo de Google se compare-t-il à d’autres modèles de génération vidéo comme Sora d’OpenAI ?
Veo se positionne comme un concurrent direct de Sora, mettant en avant sa capacité à maintenir une cohérence visuelle et à générer des vidéos longues, allant au-delà d’une minute avec 24 ou 30 images par seconde.
Quelle technologie sous-tend le fonctionnement de Veo ?
Veo utilise une architecture innovante connue sous le nom de « transformers à diffusion latente », permettant d’obtenir des séquences visuellement stables et sans artefacts.
Quelles sont les fonctionnalités spécifiques de génération vidéo de Veo ?
Veo excelle dans deux domaines : la génération de vidéos à partir de texte (text-to-video) et la transformation d’images en vidéos (image-to-video).
Veo est-il accessible au grand public ?
Actuellement, Veo est disponible uniquement en preview privée et n’est pas accessible au grand public ni à certains médias, donc son utilisation est limitée à une sélection de clients.
Quelles nouvelles vidéos a présentées Google pour démontrer les capacités de Veo ?
Google a partagé des exemples remarquables, tels qu’un ours jouant de la guitare, une foule en fête lors d’un concert électro, et un voilier naviguant sur une mer agitée, illustrant la créativité et la qualité visuelle de Veo.
Dans quel contexte Google a-t-il annoncé Veo ?
L’annonce de Veo s’est faite lors d’un moment stratégique, pendant la conférence AWS Re:Invent, afin de se positionner en tant que leader dans la course à l’IA générative vidéo.
Quels sont les avantages d’utiliser Veo pour des projets professionnels ?
Veo offre des possibilités d’utilisation dans des contextes professionnels grâce à sa capacité à générer des vidéos de haute qualité et à maîtriser des effets cinématographiques complexes tels que les time-lapses et les mouvements de caméra.
Quelles sont les limites connues de Veo à ce jour ?
Étant donné l’accès limité à Veo pour les tests pratiques, les véritables capacités et limites potentielles de l’outil restent encore une incertitude.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsCréation de vidéos : Veo de Google fait son entrée dans l'univers...

Une expérience avec un Maître de Donjon IA met en lumière les faiblesses de la communauté de Critical Role

découvrez comment une expérience immersive avec un maître de donjon ia révèle les failles de la communauté de critical role. plongez dans une analyse captivante qui met en exergue les défis et les dynamiques de cette célèbre plateforme de jeu de rôle.

Apple abandonne sa fonctionnalité de résumé d’actualités sur l’IA après une erreur sur Rafael Nadal

apple annonce la suppression de sa fonctionnalité de résumé d'actualités alimentée par l'ia, suite à une erreur notable concernant rafael nadal. découvrez les implications de cette décision et les réactions dans le monde du sport et de la technologie.

Apple met fin aux notifications d’actualités par IA suite à une polémique

apple a décidé de mettre fin aux notifications d'actualités générées par intelligence artificielle, suite à une controverse suscitée par des préoccupations éthiques et des critiques sur la qualité de l'information. découvrez les raisons de cette décision et son impact sur les utilisateurs.

Le lancement du concours Miss IA : une inquiétude grandissante pour les standards de beauté

découvrez le lancement du concours miss ia qui suscite une inquiétude grandissante quant aux nouveaux standards de beauté. analyse des enjeux sociétaux et des impacts de l'intelligence artificielle sur notre perception de l'esthétique.

Poolside : la solution française à GitHub Copilot, mettant l’accent sur la confidentialité

découvrez poolside, la solution française à github copilot. optimisée pour les développeurs, elle offre un environnement de programmation intelligent tout en garantissant la confidentialité de vos données. faites le choix de l'innovation en toute sécurité !
découvrez comment les chatbots thérapeutiques transforment le paysage de la santé mentale, tout en soulevant des questions importantes sur leur efficacité, l'éthique et l'accessibilité. plongez dans ce phénomène en pleine expansion qui pourrait redéfinir le soutien psychologique à l'ère numérique.