聯(lián)系電話:
0592-2188856
品質(zhì)帶來更好的使用體驗(yàn)
致力于為您提供優(yōu)質(zhì)的解決方案
春節(jié)余溫未消,OpenAI就在海外拋出震撼全球AI界的新聞:Sora——一款僅憑一句話就能生成60秒高清視頻的文生視頻大模型橫空出世。
盡管谷歌同日也發(fā)布了Gemini 1.5,但沒想到命運(yùn)跟汪峰老師一樣,還沒熱多久,OpenAI 就發(fā)了 Sora,很難說這不是故意向世界昭示自己在該領(lǐng)域的霸主地位,目前尚無明顯對(duì)手能與之抗衡。
Sora不僅開辟了新的AI研究疆界,更有望顛覆短視頻和影視制作行業(yè)。
官方文檔顯示,Sora能夠依據(jù)用戶輸入的一句話自然語言描述,自動(dòng)生成包含精細(xì)場景、復(fù)雜運(yùn)鏡及生動(dòng)角色表情的長達(dá)60秒的視頻內(nèi)容。
這一技術(shù)革新意味著,普通人只要有清晰的邏輯思維和創(chuàng)新想象,即可借助Sora輕松創(chuàng)作一部真正的電影作品。
人人皆導(dǎo)演的時(shí)代,來了!
01
關(guān)于Sora模型
Sora在多個(gè)方面重新定義了AI視頻生成模型的標(biāo)準(zhǔn):
時(shí)長突破:Sora將視頻長度從常見的5至15秒大幅增加到60秒,這不僅滿足了短視頻制作的需求,還預(yù)示著未來可能能夠處理更長時(shí)間的內(nèi)容。
多維視角整合:Sora能夠生成包含多個(gè)角度和鏡頭的視頻片段,并保持角色表現(xiàn)和視覺風(fēng)格的連貫性。
世界模型認(rèn)知深化:Sora增強(qiáng)了對(duì)現(xiàn)實(shí)世界的模擬理解和互動(dòng)能力,為理解和反映現(xiàn)實(shí)世界的復(fù)雜性奠定了基礎(chǔ)。
此外,Sora不僅可以用文字prompt生成視頻,還支持視頻到視頻的編輯,當(dāng)然也可以生成高質(zhì)量的圖片。Sora甚至還可以拼接完全不同的視頻,使之合二為一、前后連貫。
02
簡單的指令
60s 視頻一鏡到底
在此之前,AI文生視頻一直掙扎在4s左右,無論是Pika還是Runway。這些業(yè)內(nèi)頂尖的文生視頻選手,4s仿佛是一個(gè)“魔咒”,并且視頻生成出來的只是簡單局部的動(dòng)畫效果,甚至還不一定連貫。
在這些AI視頻工具還按秒突破瓶頸的時(shí)候,Sora一上來,4s視頻直接給你拉到60s,并且鏡頭一鏡到底,穩(wěn)定性直接拉滿;人物動(dòng)作、表情、甚至臉部細(xì)節(jié),逼真呈現(xiàn),這不只是簡單超越,而是直接掀桌了。
03
Sora實(shí)操效果
一段中國龍年舞龍的視頻,有緊跟舞龍隊(duì)伍抬頭好奇觀望的兒童,還有不少人掏出手機(jī)邊跟邊拍。
一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫城市標(biāo)牌的東京街道上,效果堪比RTX ON。
一列行駛在東京郊區(qū)的列車窗外,偶然出現(xiàn)的遮擋使得車內(nèi)人物的倒影短暫地映射出來
令人咋舌的是,Sora在模擬毛發(fā)紋理的物理特性上所展現(xiàn)出的理解力,也精準(zhǔn)得讓人瞠目結(jié)舌!
想當(dāng)初,皮克斯為打造《怪獸公司》中怪物角色那細(xì)膩復(fù)雜的動(dòng)態(tài)毛發(fā)效果,可是讓技術(shù)團(tuán)隊(duì)直接連肝幾個(gè)月,才得以實(shí)現(xiàn)。然而,Sora卻能輕松玩轉(zhuǎn)這一難題,且并未經(jīng)過任何人工刻意的教學(xué)訓(xùn)練。
當(dāng)然,目前的Sora模型尚非盡善盡美,它有時(shí)對(duì)特定情境下的因果邏輯理解存在局限。例如描述“五只灰狼幼崽在一條荒僻石徑上嬉戲追逐”,結(jié)果生成的畫面可能出現(xiàn)狼的數(shù)量忽增忽減的現(xiàn)象。
此外,在處理空間細(xì)節(jié)方面,如區(qū)分左右方向時(shí)偶爾會(huì)出現(xiàn)差錯(cuò),而在展現(xiàn)隨時(shí)間推移的事件,如特定攝影機(jī)運(yùn)動(dòng)軌跡時(shí),其精確度也有待提升。
04
帶來的影響
盡管如此,當(dāng)一個(gè)AI模型已具備初步理解和模擬現(xiàn)實(shí)世界的能力時(shí),我們不得不承認(rèn),這標(biāo)志著AGI的到來或許已不再遙遠(yuǎn)。
Sora的出現(xiàn),不僅是對(duì)影視行業(yè)的影響,可能會(huì)顛覆整個(gè)短視頻行業(yè)。
當(dāng)前,制作短視頻內(nèi)容的過程往往涉及繁瑣復(fù)雜的剪輯工作和大量素材收集,這一過程對(duì)創(chuàng)作者的時(shí)間與精力消耗頗大。
而借助OpenAI強(qiáng)大的數(shù)據(jù)訓(xùn)練集,Sora能夠根據(jù)用戶提供的文本腳本以及不同場景描述自動(dòng)生成相應(yīng)的視頻內(nèi)容。這意味著,在不久的將來,創(chuàng)作短視頻可能“一句話就解決了”。
面對(duì)AI視頻技術(shù)疾風(fēng)驟雨般的迅猛發(fā)展,我們最明智的選擇就是抓住時(shí)機(jī),投身其中,積極參與這場技術(shù)革命的洪流。