Création de vidéos : Veo de Google fait son entrée dans l’univers de Vertex AI

Publié le 3 décembre 2024 à 16h03
modifié le 3 décembre 2024 à 16h03
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

L’innovation technologique se manifeste avec éclat grâce à l’arrivée de Veo, la solution vidéo par IA proposée par Google. Ce nouvel outil redéfinit le paysage visuel en offrant des créations audiovisuelles d’une qualité inégalée. L’intégration de Veo au sein de Vertex AI souligne l’engagement continu de Google dans la sphère de l’intelligence artificielle.
Ce modèle révolutionnaire, capable de générer des vidéos en résolution 1080p, pose la question de l’avenir de la créativité numérique. La fonction image-to-video est particulièrement prometteuse, propulsant Google en leader parmi les grands de l’industrie. La cohérence visuelle et la finesse des détails sont les clefs de cette avancée notable, marquant un tournant majeur dans l’IA générative.

Veo : Une nouvelle ère pour la création vidéo par IA

Google Cloud a récemment lancé Veo, un nouvel outil de génération de vidéos par intelligence artificielle, se positionnant ainsi comme un challengerdirect à l’outil Sora d’OpenAI. En phase de preview privée, ce dispositif novateur intègre les capacités de Vertex AI pour révolutionner la production de contenu vidéo.

Caractéristiques techniques de Veo

Veo se distingue par sa faculté à générer des vidéos de haute résolution, atteignant 1080p, avec une durée dépassant la minute et une cadence de 24 ou 30 images par seconde. Ce modèle novateur excelle dans la transformation de textes en vidéos (text-to-video) ainsi que dans la conversion d’images en séquences animées (image-to-video). Ces fonctionnalités placent Google Cloud en tête des hyperscalers, offrant un ensemble d’outils unique.

Stabilité et cohérence visuelle

L’architecture employée par Google repose sur un système de transformers à diffusion latente. Cette technologie permet de garantir une cohérence visuelle inédite au sein des séquences générées. Les personnages, objets et styles demeurent stables d’une image à l’autre, ce qui minimise les artefacts visuels perturbants. Ainsi, l’expérience de visionnage s’améliore considérablement.

Un timing stratégique

Le lancement de Veo intervient à un moment où Amazon expose ses innovations en intelligence artificielle générative lors de la conférence AWS Re:Invent. Cette coïncidence favorise la réaffirmation de la position de Google dans la compétition féroce autour de l’IA générative vidéo.

Exemples de création avec Veo

Google a dévoilé plusieurs vidéos élaborées sur Veo, illustrant ses capacités impressionnantes. Parmi les exemples figurent des séquences captivantes, telles qu’un ours jouant de la guitare, une foule en liesse lors d’un concert électro, et un voilier défiant des vagues tumultueuses. Ces démonstrations mettent en avant la stabilité remarquable des résultats générés.

Effets cinématographiques et potentialités professionnelles

Veo se distingue également par sa maîtrise d’effets cinématographiques complexes, tels que le time-lapse et les mouvements de caméra. Ce potentiel d’utilisation s’avère particulièrement pertinent dans un contexte professionnel, où la qualité visuelle est primordiale.

Qualité de la vidéo générée

La qualité des vidéos résultant d’une simple image s’annonce aussi impressionnante. Les utilisateurs peuvent s’attendre à des résultats d’une clarté exceptionnelle, ouvrant ainsi la voie à de nombreuses applications créatives.

Accessibilité et évaluation des capacités

À l’instar de Sora, Veo demeure pour l’instant inaccessible au grand public. Le Journal du Numérique n’a pas pu tester le modèle en raison de cette limitation. Cette absence de test direct rend difficile l’évaluation précise de ses véritables capacités et de ses limites.

Foire aux questions sur Veo de Google et Vertex AI

Qu’est-ce que Veo et quelle est sa principale fonctionnalité ?
Veo est un générateur de vidéos par IA développé par Google, capable de créer des vidéos en 1080p à partir de textes, d’images et d’invites vidéo.
Comment Veo de Google se compare-t-il à d’autres modèles de génération vidéo comme Sora d’OpenAI ?
Veo se positionne comme un concurrent direct de Sora, mettant en avant sa capacité à maintenir une cohérence visuelle et à générer des vidéos longues, allant au-delà d’une minute avec 24 ou 30 images par seconde.
Quelle technologie sous-tend le fonctionnement de Veo ?
Veo utilise une architecture innovante connue sous le nom de « transformers à diffusion latente », permettant d’obtenir des séquences visuellement stables et sans artefacts.
Quelles sont les fonctionnalités spécifiques de génération vidéo de Veo ?
Veo excelle dans deux domaines : la génération de vidéos à partir de texte (text-to-video) et la transformation d’images en vidéos (image-to-video).
Veo est-il accessible au grand public ?
Actuellement, Veo est disponible uniquement en preview privée et n’est pas accessible au grand public ni à certains médias, donc son utilisation est limitée à une sélection de clients.
Quelles nouvelles vidéos a présentées Google pour démontrer les capacités de Veo ?
Google a partagé des exemples remarquables, tels qu’un ours jouant de la guitare, une foule en fête lors d’un concert électro, et un voilier naviguant sur une mer agitée, illustrant la créativité et la qualité visuelle de Veo.
Dans quel contexte Google a-t-il annoncé Veo ?
L’annonce de Veo s’est faite lors d’un moment stratégique, pendant la conférence AWS Re:Invent, afin de se positionner en tant que leader dans la course à l’IA générative vidéo.
Quels sont les avantages d’utiliser Veo pour des projets professionnels ?
Veo offre des possibilités d’utilisation dans des contextes professionnels grâce à sa capacité à générer des vidéos de haute qualité et à maîtriser des effets cinématographiques complexes tels que les time-lapses et les mouvements de caméra.
Quelles sont les limites connues de Veo à ce jour ?
Étant donné l’accès limité à Veo pour les tests pratiques, les véritables capacités et limites potentielles de l’outil restent encore une incertitude.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsCréation de vidéos : Veo de Google fait son entrée dans l'univers...

La bataille féroce pour détrôner Nvidia en tant que roi des puces d’IA

découvrez les enjeux de la lutte acharnée entre les géants de la technologie pour rivaliser avec nvidia, leader incontesté des puces d'intelligence artificielle. analyse des stratégies, des innovations et des défis qui façonnent cette bataille féroce et déterminent l'avenir du secteur.

Amazon lance Nova, une suite impressionnante d’outils d’IA générative

découvrez nova, la nouvelle suite d'outils d'ia générative lancée par amazon, qui révolutionne la création de contenu avec des solutions innovantes et performantes. plongez dans l'avenir de la technologie avec des fonctionnalités avancées pour stimuler votre créativité.

AWS place l’expérience client au cœur de ses nouvelles annonces sur l’IA générative

découvrez comment aws met l'accent sur l'expérience client dans ses récentes annonces concernant l'intelligence artificielle générative, en intégrant des solutions innovantes pour transformer les interactions et répondre aux besoins des utilisateurs.
découvrez comment l'intelligence artificielle transforme les revenus des créateurs de contenu dans les domaines de la musique et de l'audiovisuel. analyse des opportunités et des défis que cette technologie révolutionnaire apporte aux artistes et aux professionnels du secteur.
découvrez comment l'énergie novatrice des startups redéfinit le paysage technologique, avec des insights du responsable de google au royaume-uni sur l'émergence de l'intelligence artificielle. plongez dans les tendances qui transforment l'industrie et les opportunités offertes par l'ia pour stimuler la croissance et l'innovation.
découvrez une plateforme innovante où l'intelligence artificielle s'améliore constamment grâce à des retours humains subtils et nuancés, offrant une alternative unique aux systèmes basés sur de vastes ensembles de données.