OpenAI推新款大模型Sora,可根據(jù)文本生成60秒視頻

·Sora可根據(jù)文本指令生成60秒視頻,可生成具有多個(gè)角色、特定類型運(yùn)動(dòng)及精確主題和背景細(xì)節(jié)的復(fù)雜場景,并在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確保留角色和視覺風(fēng)格。
·OpenAI正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來“幫助人們解決需要現(xiàn)實(shí)世界互動(dòng)的問題”。不過,Sora在提示空間細(xì)節(jié)方面會(huì)混淆左右,也無法理解因果關(guān)系的具體實(shí)例。
Sora生成的視頻:幾只巨大的猛犸象穿過一片白雪覆蓋的草地,長毛在風(fēng)中輕輕飄動(dòng),遠(yuǎn)處是白雪覆蓋的樹木和大山。
開發(fā)出熱門聊天機(jī)器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣。2月16日,OpenAI推出新的AI大模型Sora,該文生視頻大模型可通過快速文本提示創(chuàng)建“逼真”和“富有想象力”的60秒視頻。
OpenAI表示,Sora能夠根據(jù)文本指令生成長達(dá)60秒的視頻,同時(shí)保持視覺質(zhì)量并遵守用戶提示。Sora可生成具有多個(gè)角色、特定類型運(yùn)動(dòng)以及精確主題和背景細(xì)節(jié)的復(fù)雜場景。該模型對(duì)語言有深刻理解,能夠準(zhǔn)確領(lǐng)會(huì)提示,生成令人信服的角色。Sora還可以在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確保留角色和視覺風(fēng)格。
Sora生成的視頻:一只貓叫醒了正在睡覺的主人。
“這個(gè)模型不僅能理解用戶在提示中要求什么,還能理解這些東西在現(xiàn)實(shí)世界中是如何存在的。”O(jiān)penAI表示,正在教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來“幫助人們解決需要現(xiàn)實(shí)世界互動(dòng)的問題”。
除了能夠僅從文本指令生成視頻外,該模型還能夠利用現(xiàn)有的靜止圖像從中生成視頻,精確地將圖像內(nèi)容動(dòng)畫化,也可以利用現(xiàn)有視頻進(jìn)行擴(kuò)展或填充缺失的幀。
Sora有時(shí)會(huì)生成不合情理的動(dòng)作,譬如在跑步機(jī)上倒著跑步。
不過,Sora仍在開發(fā)中,存在明顯“弱點(diǎn)”,特別是在提示空間細(xì)節(jié)方面會(huì)混淆左右,也無法理解因果關(guān)系的具體實(shí)例,比如制作了一個(gè)視頻,視頻中有人咬了一口餅干,但之后餅干上沒有咬痕。
Sora生成的視頻:五只小狼在一條礫石路上嬉戲追逐,周圍長滿了草。Sora的缺點(diǎn)是動(dòng)物或人會(huì)憑空出現(xiàn),特別是在包含許多實(shí)體的場景中。
Sora生成的視頻中,動(dòng)物或人會(huì)憑空出現(xiàn),特別是在包含許多實(shí)體的場景中。此外,Sora難以精確描述隨時(shí)間推移發(fā)生的事件,例如跟蹤攝像機(jī)的特定軌跡。
Sora生成的視頻:一把普通的塑料椅子在沙漠中被發(fā)現(xiàn),人們小心翼翼地挖掘并撣去沙子。在這個(gè)例子中,Sora沒有將椅子建模為一個(gè)剛性物體,導(dǎo)致不準(zhǔn)確的物理交互。
對(duì)于模型安全性的考量,OpenAI表示,計(jì)劃與一個(gè)專家團(tuán)隊(duì)合作測試最新模型,密切關(guān)注錯(cuò)誤信息、仇恨內(nèi)容和偏見等。OpenAI還表示正在開發(fā)幫助檢測誤導(dǎo)性信息的工具,比如檢測分類器可以判斷視頻是何時(shí)由Sora生成的。其文本分類器可檢查并拒絕違反使用政策的文本輸入提示,例如極端暴力、性內(nèi)容、仇恨圖像、名人肖像等。“我們還開發(fā)了魯棒性的圖像分類器,用于審查每個(gè)生成視頻的幀,以幫助確保它在顯示給用戶之前符合我們的使用政策。”
OpenAI表示,Sora將首先提供給網(wǎng)絡(luò)安全教授,以評(píng)估產(chǎn)品的危害或風(fēng)險(xiǎn)。一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人也能獲得Sora的訪問權(quán)限,以此收集關(guān)于創(chuàng)意專業(yè)人士如何使用Sora的反饋。
Sora生成的視頻:在“賽博朋克”背景下,一個(gè)機(jī)器人的生活故事。
市場研究公司ABI research高級(jí)分析師里斯·海登(Reece Hayden)表示,盡管多模態(tài)大模型并不新鮮,而且文生視頻的模型已經(jīng)存在,但OpenAI聲稱Sora具有的長度和準(zhǔn)確性使其與眾不同。海登認(rèn)為,這類人工智能模型可能會(huì)對(duì)數(shù)字娛樂市場產(chǎn)生重大影響,新的個(gè)性化內(nèi)容將在各個(gè)渠道傳播,“一個(gè)明顯的用例是電視,創(chuàng)造簡短的場景來支持?jǐn)⑹隆!?span style="display:none">IL2知多少教育網(wǎng)-記錄每日最新科研教育資訊
本文鏈接:http://knowith.com/news-3-245.htmlOpenAI推新款大模型Sora,可根據(jù)文本生成60秒視頻
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
2023年度山東省優(yōu)秀青年科學(xué)基金項(xiàng)目擬立項(xiàng)項(xiàng)目公布
福建科技廳批準(zhǔn)認(rèn)定建設(shè)第二批野外科學(xué)觀測研究站
陜西征集區(qū)域創(chuàng)新發(fā)展聯(lián)合基金項(xiàng)目指南建議
2023年度湖北省科學(xué)技術(shù)獎(jiǎng)擬獎(jiǎng)項(xiàng)目公示
基金委發(fā)布與歐盟委員會(huì)“中歐人才項(xiàng)目”指南
中國水利水電科學(xué)研究院公示3項(xiàng)科技進(jìn)步獎(jiǎng)申報(bào)結(jié)果
公司展望未來的唯美句子
冬日暖陽的唯美句子
描寫臘八的詩句
《詩經(jīng)》的課文解釋分析
單位經(jīng)辦人授權(quán)委托書
萬萬沒想到西游篇臺(tái)詞
肝科護(hù)理工作計(jì)劃
業(yè)務(wù)下半年工作計(jì)劃
2024年社區(qū)網(wǎng)格員工作計(jì)劃
個(gè)人委托書的收款
逛燈會(huì)買花燈,第39屆秦淮燈會(huì)五大展區(qū)速查版攻略來了
印度阿昔替尼真實(shí)價(jià)格最新一覽表!2025靶向藥阿昔替尼多少錢一盒?國內(nèi)渠道:印度阿昔替尼代購價(jià)格阿昔替尼yb價(jià)格官宣
2025省心可靠:印度艾曲泊帕代購哪里買?如何獲取?不出國代購印度艾曲泊帕(Eltrombopag)多少錢一盒市場報(bào)價(jià)現(xiàn)已公布!
總結(jié)兩個(gè)辦法:DY月付24小時(shí)套現(xiàn)秒到商家
勤學(xué)不怠:花唄信用購怎么提現(xiàn)出來(5個(gè)最新取現(xiàn)方法)
十年商家: 羊小咩商城提現(xiàn)秒到秒回款!! 超級(jí)實(shí)用提現(xiàn)方法
風(fēng)馳電掣:青島黃島區(qū)代還信用卡墊還,怎么刷出來,5種常用方式
大額必看秒到操作: 羊小咩享花卡額度怎么取現(xiàn) 介紹三種套出來方法!
夜以繼日:羊小咩享花卡怎么套出來現(xiàn)金(推薦最新的3個(gè)方法)
橫評(píng):哪里可以刷微信分付,實(shí)操12種方法具體詳細(xì)步驟