關于我們
當前位置 >首頁 > 關于我們 > 新聞動态

周鴻祎:Sora意味着實現通用人工智能可(kě)能從10年(nián)縮短(duǎn)至1年(nián)

發布日期: 2024-02-18

       “Sora隻是小試牛刀,它展現的(de)不僅僅是一(yī)個視(shì)頻制作的(de)能力,而是大模型對真實世界有了理(lǐ)解和(hé)模拟之後,會帶來新的(de)成果和(hé)突破。”

         360創始人周鴻祎發布微博提到自(zì)己對Sora的(de)看法,周鴻祎認為(wèi),Sora的(de)誕生意味着AGI(通用人工智能)實現可(kě)能從10年(nián)縮短(duǎn)至一(yī)兩年(nián)。

        OpenAI近日宣布,正在研發“文生視(shì)頻”模型Sora,可(kě)以創建長(cháng)達60秒的(de)視(shì)頻,其中包含高(gāo)度詳細的(de)場景、複雜的(de)攝像機運動以及充滿活力的(de)情感的(de)多個角色,也可(kě)以根據靜态圖像制作動畫。

        周鴻祎認為(wèi),科技競争最終比拼的(de)是讓人才密度和(hé)深厚積累,“很多人說Sora的(de)效果吊打Pika和(hé)Runway。這很正常,和(hé)創業者團隊比,OpenAl這種有核心技術的(de)公司實力還是非常強勁的(de)。有人認為(wèi)有了AI以後創業公司隻需要做(zuò)個體戶就行,實際今天再次證明這種想法是非常可(kě)笑的(de)。”

         此外,AI不一(yī)定那麽快颠覆所有行業,但它能激發更多人的(de)創作力。周鴻祎表示,很多人擔心Sora對影視(shì)工業的(de)打擊,在他看來,機器能生産一(yī)個好視(shì)頻,但視(shì)頻的(de)主題、腳本和(hé)分鏡頭策劃、台詞的(de)配合,都需要人的(de)創意,至少需要人給提示詞。一(yī)個視(shì)頻或者電影是由無數個60秒組成的(de)。今天Sora可(kě)能給廣告業、電影預告片、短(duǎn)視(shì)頻行業帶來巨大的(de)颠覆,但它不一(yī)定那麽快擊敗TikTok,更可(kě)能成為(wèi)TikTok的(de)創作工具。

       談到Sora最大的(de)優勢,周鴻祎表示,以往文生視(shì)頻軟件都是在2D平面上對圖形元素進行操作,可(kě)以把視(shì)頻看成是多個真實圖片的(de)組合,并沒有真正掌握這個世界的(de)知識。但Sora産生的(de)視(shì)頻裏,它能像人一(yī)樣理(lǐ)解坦克是有巨大沖擊力的(de),坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的(de)情況,“這次OpenAI利用它的(de)大語言模型優勢,讓Sora實現了對現實世界的(de)理(lǐ)解和(hé)對世界的(de)模拟兩層能力,這樣産生的(de)視(shì)頻才是真實的(de),才能跳出2D的(de)範圍模拟真實的(de)物理(lǐ)世界。

       周鴻祎提到,有了大模型技術作為(wèi)基礎,再加上人類知識的(de)引導,可(kě)以創造各個領域的(de)超級工具,例如(rú)在生物醫學(xué)、蛋白質、基因研究,包括物理(lǐ)、化學(xué)、數學(xué)的(de)學(xué)科研究上,大模型都會發揮作用。

     “一(yī)旦人工智能接上攝像頭,把所有的(de)電影都看一(yī)遍,把YouTube上和(hé) TikTok 的(de)視(shì)頻都看一(yī)遍,對世界的(de)理(lǐ)解将遠遠超過文字學(xué)習,一(yī)幅圖勝過千言萬語,這就離(lí)AGI真的(de)就不遠了,不是10年(nián)20年(nián)的(de)問題,可(kě)能一(yī)兩年(nián)很快就可(kě)以實現。”周鴻祎感慨。

       他還提到,盡管國內(nèi)大模型發展水平表面看已經接近GPT-3.5,但實際上跟4.0比還有一(yī)年(nián)半的(de)差距。OpenAl手裏應該還有一(yī)些秘密武器,無論是GPT-5,還是機器自(zì)我學(xué)習自(zì)動産生內(nèi)容,“奧特曼(OpenAI CEO)是個營銷大師,知道(dào)怎樣掌握節奏,他們手裏的(de)武器并沒有全拿出來。這樣看來中國跟美國的(de)AI差距可(kě)能還在加大。