Révolution Visuelle : Les Nouvelles Innovations Vidéo et Image de Google Grâce à l'IA

在數位創作上的重大進展。 Google 正在進行一場引人入勝的科技競爭，直接與 OpenAI 競爭。近期的人工智能進展突顯了創造視覺內容的前所未有的能力。 視頻生成達到了全新的現實主義層次。 公司推出了 Veo 2 和 Imagen 3，這些革命性的 AI 模型可以輕鬆創作出質量驚人的視頻和圖片。 創意潛力超出了預期。 讓我們來分析這些重大的創新，透過人工智能重新定義創造力。

Google 希望透過在視頻生成和人工智能圖像領域引入多項創新來對抗 OpenAI 的動力。

發佈日期 2024 年 12 月 17 日 11:10

Veo 2：一個優化的視頻創作模型

在五月介紹 Veo 之後，Google 推出了 Veo 2，該版本是其視頻生成模型的升級版。這次更新旨在加強 對現實世界物理的理解 和 人類動作的細微差別。這些改進促進了該模型生成的視頻的更高現實主義。

Veo 2 的特色在於其創建合成視頻和有效回應具體要求的能力。例如，用戶可以請求 低角度 拍攝或面部特寫，系統能夠有效回應。還整合了如廣角和 淺景深 的鏡頭建議。

最高解析度提高到 4K，允許視頻創作長達幾分鐘。Google 保證，像幻覺這樣的不當現象（如意外物體或錯誤元素）會減少。來自 Veo 2 的視頻示範揭示出令人印象深刻的質量，儘管長時間的序列仍需驗證。

Imagen 3：重新定義的圖像生成器

模型 Imagen 3 代表了圖像創作的重要進步。Google 宣稱這一版本提供的圖像「更明亮且構圖更佳」。風格從 照片寫實主義 到 印象派 變化，還包括抽象和動畫渲染。更新後對指示的遵循更為嚴謹，精細化了所提供的結果。

目前，Imagen 3 自 2024 年 8 月以來可以通過 Gemini 訪問，雖然這一更新最初僅限於 ImageFX。該模型能準確跟隨用戶的請求，提供了真正的創意靈活性。

Whisk：創新的圖像重塑工具

除了這些創新外，Google 還推出了一個名為 Whisk 的工具。這一工具可將多張圖像合併為一個作品。用戶可以導入或生成展示角色、場景和視覺風格的圖像。然後，Whisk 將這些元素結合以生成新圖像。

這個應用程式讓用戶的創意方式變得更具合作性和直觀性。通過文本請求對結果進行精細化的可能性擴展了創作的範圍。

關於 Google 在視頻和圖像創作中的人工智能創新的常見問題解答

Google 在 AI 基於生成視頻方面的主要新功能是什麼？
Google 最近推出的 Veo 2 是一個改進的模型，能夠在 4K 分辨率下生成視頻，並對人類運動和表情有進一步的理解。這使得創造的內容比其前身更具現實感和動態性。
Google 的新工具 Whisk 在圖像創作中的工作原理是什麼？
Whisk 允許用戶混合多張圖像以生成新插圖。通過導入如角色、場景和風格等不同元素，Whisk 將這些請求組合成一幅增強了精確性的圖像。
對於圖像創作，Imagen 3 作出了哪些改進？
Imagen 3 已經優化以生成更明亮、更佳構圖的圖像，同時支持多種風格，從照片寫實主義到抽象。這些改進使得對用戶指示的跟隨更加準確。
Google 的視頻生成技術在歐洲是否可以使用？
目前，新功能和改進的視頻與圖像生成工具尚未在歐洲推出，且其推出可能會在稍後進行。
透過 Veo 2 可以實現哪些類型的項目？
Veo 2 允許實現各種項目，例如個性化的電影場景，對於特定的攝影角度或景深效果的詳細請求也能作出回應。
使用 Veo 2 生成的視頻是否有關於時長的限制？
雖然 Veo 2 能夠生成持續數分鐘的視頻，但需要注意的是，視頻生成模型有時在維持長時間一致性上可能會面臨挑戰。
Google 的人工智能與市場上其他視頻生成器相比的優勢是什麼？
Google 的模型，如 Veo 2，以其理解複雜指令的能力和生成高品質視頻，並盡量減少如視覺幻覺等錯誤而脫穎而出。
我應該如何使用這些新的 AI 工具，特別是針對我的創意項目？
用戶可以通過谷歌的平台訪問這些模型，在那裡他們可以嘗試使用影片和圖像創作工具，並融合他們自己的想法和風格。
Google 在人工智能領域的創新是否會影響創意行業？
是的，這些進展為創作者開辟了新的前景，使他們更輕鬆地產生高質量的視覺和音頻內容，從而探索創新的敘事方法。
如何促進向使用人工智能進行視頻和圖像創作的轉變？
用戶可以熟悉 Google 工具的用戶界面，參加教程並逐步實驗，以充分了解這些 AI 模型所提供的能力和功能。