在數位創作上的重大進展。 Google 正在進行一場引人入勝的科技競爭,直接與 OpenAI 競爭。近期的人工智能進展突顯了創造視覺內容的前所未有的能力。 視頻生成達到了全新的現實主義層次。 公司推出了 Veo 2 和 Imagen 3,這些革命性的 AI 模型可以輕鬆創作出質量驚人的視頻和圖片。 創意潛力超出了預期。 讓我們來分析這些重大的創新,透過人工智能重新定義創造力。
Google 希望透過在視頻生成和人工智能圖像領域引入多項創新來對抗 OpenAI 的動力。
發佈日期 2024 年 12 月 17 日 11:10
Veo 2:一個優化的視頻創作模型
在五月介紹 Veo 之後,Google 推出了 Veo 2,該版本是其視頻生成模型的升級版。這次更新旨在加強 對現實世界物理的理解 和 人類動作的細微差別。這些改進促進了該模型生成的視頻的更高現實主義。
Veo 2 的特色在於其創建合成視頻和有效回應具體要求的能力。例如,用戶可以請求 低角度 拍攝或面部特寫,系統能夠有效回應。還整合了如 廣角 和 淺景深 的鏡頭建議。
最高解析度提高到 4K,允許視頻創作長達幾分鐘。Google 保證,像 幻覺 這樣的不當現象(如意外物體或錯誤元素)會減少。來自 Veo 2 的視頻示範揭示出令人印象深刻的質量,儘管長時間的序列仍需驗證。
Imagen 3:重新定義的圖像生成器
模型 Imagen 3 代表了圖像創作的重要進步。Google 宣稱這一版本提供的圖像「更明亮且構圖更佳」。風格從 照片寫實主義 到 印象派 變化,還包括抽象和動畫渲染。更新後對指示的遵循更為嚴謹,精細化了所提供的結果。
目前,Imagen 3 自 2024 年 8 月以來可以通過 Gemini 訪問,雖然這一更新最初僅限於 ImageFX。該模型能準確跟隨用戶的請求,提供了真正的創意靈活性。
Whisk:創新的圖像重塑工具
除了這些創新外,Google 還推出了一個名為 Whisk 的工具。這一工具可將多張圖像合併為一個作品。用戶可以導入或生成展示角色、場景和視覺風格的圖像。然後,Whisk 將這些元素結合以生成新圖像。
這個應用程式讓用戶的創意方式變得更具合作性和直觀性。通過文本請求對結果進行精細化的可能性擴展了創作的範圍。
關於 Google 在視頻和圖像創作中的人工智能創新的常見問題解答
Google 在 AI 基於生成視頻方面的主要新功能是什麼?
Google 最近推出的 Veo 2 是一個改進的模型,能夠在 4K 分辨率下生成視頻,並對人類運動和表情有進一步的理解。這使得創造的內容比其前身更具現實感和動態性。
Google 的新工具 Whisk 在圖像創作中的工作原理是什麼?
Whisk 允許用戶混合多張圖像以生成新插圖。通過導入如角色、場景和風格等不同元素,Whisk 將這些請求組合成一幅增強了精確性的圖像。
對於圖像創作,Imagen 3 作出了哪些改進?
Imagen 3 已經優化以生成更明亮、更佳構圖的圖像,同時支持多種風格,從照片寫實主義到抽象。這些改進使得對用戶指示的跟隨更加準確。
Google 的視頻生成技術在歐洲是否可以使用?
目前,新功能和改進的視頻與圖像生成工具尚未在歐洲推出,且其推出可能會在稍後進行。
透過 Veo 2 可以實現哪些類型的項目?
Veo 2 允許實現各種項目,例如個性化的電影場景,對於特定的攝影角度或景深效果的詳細請求也能作出回應。
使用 Veo 2 生成的視頻是否有關於時長的限制?
雖然 Veo 2 能夠生成持續數分鐘的視頻,但需要注意的是,視頻生成模型有時在維持長時間一致性上可能會面臨挑戰。
Google 的人工智能與市場上其他視頻生成器相比的優勢是什麼?
Google 的模型,如 Veo 2,以其理解複雜指令的能力和生成高品質視頻,並盡量減少如視覺幻覺等錯誤而脫穎而出。
我應該如何使用這些新的 AI 工具,特別是針對我的創意項目?
用戶可以通過谷歌的平台訪問這些模型,在那裡他們可以嘗試使用影片和圖像創作工具,並融合他們自己的想法和風格。
Google 在人工智能領域的創新是否會影響創意行業?
是的,這些進展為創作者開辟了新的前景,使他們更輕鬆地產生高質量的視覺和音頻內容,從而探索創新的敘事方法。
如何促進向使用人工智能進行視頻和圖像創作的轉變?
用戶可以熟悉 Google 工具的用戶界面,參加教程並逐步實驗,以充分了解這些 AI 模型所提供的能力和功能。