就在不久之前 OpenAI 推出了自己的全新 AI 視頻生成模型 Sora,谷歌也不甘落后就在中國時間今天凌晨的時候谷歌推出了全新的 Veo 2 視頻生成模型以及改進的 Image 3 圖像生成模型。
我們先來了解一下 Veo 2 視頻生成模型,就相比 OpenAI 官方公布的視頻內(nèi)容來看,Veo 2 模型生成的視頻看著更加的真實一些,Sora 模型僅能生成最高 1080p 分辨率的視頻同時時長比較短,而 Veo 2 可以生成 4K 分辨率時間長幾分鐘的視頻。
上面給大家附帶了一個谷歌官方發(fā)布的 AI 視頻,可以看見視頻非常的逼真就像是直接拍攝的現(xiàn)實世界一樣。還有一個動畫的視頻,里面的人物看著也非常的靈動。(視頻經(jīng)過壓縮可能不是很清除,感興趣的可以前往谷歌 Veo 2 官網(wǎng)中查看:https://deepmind.google/technologies/veo/veo-2/)
谷歌表示 Veo 2 能更好地理解現(xiàn)實世界的物理現(xiàn)象以及人類動作和表情的細微差別,有助于整體改善細節(jié)和真實感。同時 Veo 2 將引入 Google Labs 視頻生成工具 VideoFX,并擴大可以訪問該工具的用戶數(shù)量,可以訪問 Google Labs 注冊候補名單。谷歌還計劃明年將 Veo 2 擴展到 YouTube Shorts 和其他產(chǎn)品。對了該模型生成的視頻同樣會有一個看不見的水印來辨別是不是 AI 生成的視頻。
再來看看 Image 3,這個圖像生成模型是之前就推出過的,谷歌將其改進之后跟著 Veo 2 重新推出,該模型可以生成更明亮、構(gòu)圖更好的圖像。
最新的 Imagen 3 模型將在全球 100 多個國家/地區(qū)推出圖像生成工具 ImageFX。
除了 Veo 2 和 Image 3 之外,谷歌還將推出一款有趣的新工具 Whisk,它允許你輸入或創(chuàng)建能夠表達你心中主題、場景和風(fēng)格的圖像。然后可以將它們組合在一起并重新混合,以創(chuàng)建屬于自己的獨特圖像。
在底層,Whisk 將最新的 Imagen 3 模型與 Gemini 的視覺理解和描述功能相結(jié)合。Gemini 模型會自動為你創(chuàng)建的圖像編寫詳細的說明,然后將這些說明輸入到 Imagen 3 中。
雖然從目前來看谷歌的 Veo 2 生成的視頻比 OpenAI Sora 生成的視頻要更真實一點,但是還是需要看后續(xù)的優(yōu)化。
本文編輯:@ 小小輝
?本文著作權(quán)歸電手所有,未經(jīng)電手許可,不得轉(zhuǎn)載使用。