OpenAI首個AI視頻模型Sora的顛覆與爭議
【編輯推薦】有人說,這是影響影視行業(yè)和未來技術(shù)發(fā)展的又一顛覆性事件?,也難怪大家驚呼“現(xiàn)實,不存在了!”不過,Sora和文生圖一樣,普遍存在生成內(nèi)容不夠精確,所以離真正顛覆影視行業(yè)還有很大一段距離。可以肯定的是,這些新的工具和產(chǎn)品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來,未來誰能快速掌握這些AI工具和技術(shù)的使用,誰才是真正的掌控者。
太炸裂了!2月16日凌晨,OpenAI在社交平臺X上宣布,正在開發(fā)一款名為Sora的新模型。
Sora可以做什么?它的主要功能是把文本描述轉(zhuǎn)化為視頻,它能夠理解并執(zhí)行詳細(xì)的文本指令,從而生成具有視覺質(zhì)量和連貫性的視頻。這些視頻可以包含多個角色、動作和場景,還可以根據(jù)提示的主題和背景,精準(zhǔn)生成影片內(nèi)容,呈現(xiàn)復(fù)雜的攝影機運鏡,影片長度最多為60秒。除了根據(jù)文字產(chǎn)生影片外,它還能夠從靜態(tài)圖像生成動畫,或擴展現(xiàn)有視頻。
雖然,目前它尚未對大眾開放使用,不過消息一出,它已經(jīng)在網(wǎng)絡(luò)上引發(fā)討論,很多人表示大為震撼。
來看一組展示,一位時尚女性走在霓虹閃爍的東京街頭;一位20多歲的年輕人正在一片云上讀書,中國龍慶祝中國新年……其實它的獨特之處在于,它不再是一種創(chuàng)造性工具,更像是一個“數(shù)據(jù)驅(qū)動的物理引擎”。它不僅了解用戶在提示中提出的要求,然后根據(jù)你的需求生成圖像,還能確定環(huán)境中對象的物理特性,并根據(jù)這些計算渲染視頻。
有人說,這是影響影視行業(yè)和未來技術(shù)發(fā)展的又一顛覆性事件?。也難怪大家驚呼,現(xiàn)實,不存在了!
而這些能夠?qū)崿F(xiàn)背后依靠的是擴散模型,這意味著Sora會從模糊充滿靜態(tài)的視頻開始生成,然后再慢慢將其平滑處理成你看到的精美版本。
我們知道之前發(fā)布的Midjourney和Stable Diffusio也是擴散模型,但不得不說,Sora制作的視頻比它們更長、更有活力、也更流暢。
Sora感覺像是創(chuàng)建了一個真實的視頻,而Midjourney和Stable Diffusio模型感覺像是人工智能圖像的定格動畫。不過Sora目前還是一個未完成的產(chǎn)品,它可能難以消化復(fù)雜的物理或空間細(xì)節(jié),進而導(dǎo)致它生成不合邏輯的影片,比如人類在跑步機上跑錯方向、比如可能會生成一個人咬餅干的視頻,但之后餅干可能沒有咬痕。并且可能會難以遵循特定的運鏡軌跡。
OpenAI表示該模型缺乏空間意識可能會混淆左右,并且不理解人或物體如何與場景交互。可以看出,Sora和文生圖一樣,普遍存在生成內(nèi)容不夠精確的問題,所以,從這個角度而言,它離真正顛覆影視行業(yè)還有很大一段距離。隨著這兩年人工智能熱潮的持續(xù)推進,相關(guān)產(chǎn)品也備受爭議。但不得不承認(rèn),這些新的工具和產(chǎn)品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來。未來誰能快速掌握這些AI工具和技術(shù),誰才是真正的掌控者。
原文標(biāo)題 : OpenAI首個AI視頻模型Sora的顛覆與爭議

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 人形機器人廠商,正在批量復(fù)刻宇樹G1
- 4 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 5 自動駕駛誰將笑傲江湖?如何把握無人駕駛“財富密碼”?
- 6 特斯拉機器人獲得10,000臺訂單?馬斯克抄底成功
- 7 華為公布昇騰芯片三年計劃,自研HBM曝光
- 8 硬剛英偉達(dá)!華為發(fā)布全球最強算力超節(jié)點和集群
- 9 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?