2月18日,國海證券發布研報稱,Sora的推出,體現出大模型進化速度的超預期,這或將是通往AGI(通用人工智能)時代的里程碑。國內大模型將受益于海外技術交流和開源,國產大模型多模態和通用能力將追趕GPT4-turbo和Sora等。
近日,OpenAI推出全新的文生視頻大模型Sora,AI視頻生成迎來“GPT時刻”。在Open AI公布的48個樣片中,Sora展現出令人驚嘆的視頻生成效果,視頻時長提升至1分鐘,生成的角色表情逼真,還實現了多角度鏡頭切換與流暢分鏡,可展現真實光影、運動和鏡頭移動效果。
Sora是一個擴散Transformer模型,通過采用Diffusion Transformer等技術處理不同持續時間、分辨率和比例的視頻/圖像,實現“世界模擬器”,達到理解真實世界的運動和物理能力。
業內人士表示,世界模擬器是AI生成視頻的一種方式,它的成功會帶動視頻生成賽道的發展,加速視頻生成的創新和成熟。
面對AI視頻生成領域的廣闊前景,國內各廠商正加大投入,推動AI視頻生成進入全新時代。字節跳動于去年11月發布PixelDance模型,不僅在視頻時長上實現了突破,還可通過描述(純文本)+首幀指導(圖片)+尾幀指導(圖片),生成包含復雜場景和動作的視頻,用上一個視頻片段尾幀為下一個視頻頭幀提供指導思路。
萬興科技于今年年初推出國內首個以音視頻為核心的多媒體大模型萬興“天幕”。定位上,萬興“天幕”是音視頻多媒體創作垂類大模型,由視頻、音頻、圖片、語言大模型組成;能力上,萬興“天幕”涵蓋當前市面上語言、音頻、圖像的大模型能力,文生視頻能力是萬興“天幕”的子能力之一;用戶方面,萬興“天幕”面向更細分垂直的市場,包括泛知識、泛營銷、泛娛樂等領域,相關能力已在海外規?;逃?。
AI視頻生成賽道前景廣闊。數據顯示,截至2023年末,僅國內短視頻用戶規模就已突破10億人。
在業內人士看來,Sora是AGI(通用人工智能)實現的重要里程碑,Sora的出現將全球目光聚焦于視頻生成領域,驗證了視頻為王的趨勢,也進一步驗證了無視頻不傳播的時代,“視頻+大模型”的應用市場空間不斷擴展。
日前,國泰君安證券發布研報稱,Sora模型推動AI多模態領域飛躍式發展,AI創作等相關領域將迎來深度變革,AI賦能范圍進一步擴大,推薦萬興科技、金山辦公、科大訊飛、虹軟科技等標的。
責任編輯:方杰
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。