上個月,OpenAI公司推出了文生視頻人工智能(AI)模型Sora。OpenAI展示了Sora利用少量簡短文字提示即可創(chuàng)建逼真視頻的能力,并提供了包括一位女士在閃爍著霓虹燈的東京街道漫步,以及一只狗在兩個窗臺之間跳躍的視頻片段。
Sora所展現(xiàn)的能力和潛力很快引起了科技界、商界和投資界的高度關(guān)注。OpenAI表示,根據(jù)文字提示生成視頻只是其整體計劃中的一步。ChatGPT在AI準確理解和生成自然語言表達方面取得了突破,而Sora則更進一步,在理解自然語言的基礎(chǔ)上創(chuàng)建了更復(fù)雜的視頻內(nèi)容。
OpenAI相信,順應(yīng)AI發(fā)展的邏輯和技術(shù)進步的趨勢,Sora未來會創(chuàng)作出更加精致、更加真實的作品,在各個領(lǐng)域的應(yīng)用也更加多樣化。如果這些應(yīng)用與其他技術(shù)相結(jié)合,將對世界產(chǎn)生重大影響。
AI原生產(chǎn)品潛在應(yīng)用多
Sora并不是文生視頻技術(shù)的第一個例子。去年6月,谷歌支持的人工智能初創(chuàng)公司Runway發(fā)布了Gen-2,這是一款根據(jù)文本提示或現(xiàn)有圖像生成視頻的模型。今年1月,谷歌研究院推出了一款名為Lumiere的文生視頻擴散模型,號稱能夠一次生成“完整、真實、動作連貫”的視頻。
英國《自然》雜志報道稱,Sora等AI原生產(chǎn)品有不少潛在的好處。英國德蒙福特大學數(shù)字文化專家特蕾西·哈伍德指出,該技術(shù)可以一種更便于理解的方式來呈現(xiàn)晦澀難懂的文本,比如學術(shù)論文。其最重要的用途之一,就是形象化地表達復(fù)雜概念,并將研究結(jié)果傳達給外行人。
該技術(shù)另一個潛在用途可能是醫(yī)療保健,文生視頻AI能夠代替人類醫(yī)生與患者交談。英國科普咨詢師克萊爾·馬隆表示,有些人可能會覺得這令人不安。但人們也可能會發(fā)現(xiàn),如果他們想要在一天內(nèi)多次詢問醫(yī)療人員專業(yè)問題,這會非常方便。
馬隆說,像Sora這樣的文生視頻AI工具可幫助研究人員深入研究龐大的數(shù)據(jù)集。生成式AI可篩選出代碼并完成一般研究任務(wù),但也可“做更復(fù)雜的工作,比如向它提供數(shù)據(jù),并要求它作出預(yù)測”。
將AI戰(zhàn)場引向影視創(chuàng)作
美國“歐亞評論”網(wǎng)站稱,Sora將對一些行業(yè)發(fā)展和相關(guān)就業(yè)產(chǎn)生影響。ChatGPT上線后,很多行業(yè)開始改變運營方式,有些職業(yè)受到?jīng)_擊,工作崗位開始被AI取代。引入Sora之后,類似的事情也會發(fā)生。從網(wǎng)上的反映來看,影視行業(yè)專業(yè)人士的擔憂最為嚴重。
美國演員湯姆·漢克斯表示,他正在使用AI技術(shù)拓展他去世后繼續(xù)職業(yè)生涯的前景。對此,英國雷丁大學研究創(chuàng)造性AI和電影制作的多米尼克·利斯稱:“如果你是一名雄心勃勃的年輕演員,正在規(guī)劃自己的未來,而你被告知‘對不起,湯姆·漢克斯將永遠扮演主角’,你還會打算未來投身表演業(yè)嗎?”
就在去年,好萊塢編劇發(fā)起了全行業(yè)罷工,抗議制作公司廣泛使用AI進行劇本創(chuàng)作。Sora的出現(xiàn),完全可將AI戰(zhàn)場引向好萊塢,甚至對全球影視行業(yè)產(chǎn)生重大影響。
當然,AI應(yīng)用的進步也會催生大量新職業(yè)。但如果人類的學習和知識技能的積累被AI所取代,世界將會發(fā)生重大變化。ChatGPT無需上法學院即可通過律師資格考試,而Sora則無需上電影學院也能拍電影。
倫理、法律和社會影響不容忽視
哈伍德表示,虛假信息是文生視頻技術(shù)的主要挑戰(zhàn)。她說:“我們很快就會被大量引人注目的信息淹沒,這真的很令人擔憂!
《科學美國人》雜志報道稱,AI有可能復(fù)制或高度模仿受版權(quán)保護的作品,并將其作為原創(chuàng)生成內(nèi)容呈現(xiàn)。
“歐亞評論”網(wǎng)站稱,數(shù)字時代的各種問題將因AI技術(shù)的進步而加劇。想象一下,在未來社會,如果數(shù)十億網(wǎng)民可使用類似Sora的工具輕松制作和發(fā)布視頻或電影,世界將會變成什么樣?
盡管互聯(lián)網(wǎng)的出現(xiàn)使得信息的獲取、創(chuàng)造和傳播成為民眾的“普遍權(quán)力”,但其并沒有帶來真正的信息多樣性。海量信息時代仍然存在信息壟斷和“有效信息沙漠”;ヂ(lián)網(wǎng)底層核心技術(shù)和規(guī)則的掌控者仍然可以控制信息受眾。例如,高層次的AI大模型技術(shù)和應(yīng)用可能會被極少數(shù)公司所控制,這些AI巨頭擁有難以被法律約束的另一種權(quán)力。如果按這樣的軌跡發(fā)展下去,AI巨頭很可能成為無所不能的“怪物”。
《自然》雜志表示,文生視頻AI工具讓每個人都有機會成為媒體內(nèi)容創(chuàng)作者,但它同時將給社會帶來廣泛的問題。人們必須換一種思路來評估所看到的內(nèi)容,以應(yīng)對這種消費方式的根本性轉(zhuǎn)變。
來源:《科技日報》
|