清華大學五道口金融學院中國金融案例中心于2013年6月成立,是從事金融案例研究、案例開發、案例庫建設的專業研究和教學服務機構,致力于打造最具學術影響力和業界影響力的中國金融案例庫。中心學術指導委員會成員由學院享有國際聲望的知名教授以及有著豐富金融實踐經驗的業界導師組成,致力于以案例為載體的知識傳播。
【中國金融案例中心 文:葉子 編輯:謝彬彬】
導讀
成立于2015年4月的OpenAI是一家總部位于美國的人工智能研究機構,致力于“創建造福全人類的安全通用人工智能模型”。OpenAI的研究范圍包括自然語言處理、機器學習、機器人技術等多個領域,已開發了多個文本生成、圖像生成以及音頻生成模型,所發布的ChatGPT產品被認為開啟了“人工智能新紀元”。盡管OpenAI在隱私保護與版權方面存在著爭議,但其發展前景與商業價值不容小覷,目前其估值已達800億美元。
Part 1 公司簡介
1.1 公司概述
OpenAI成立于2015年,是一家位于美國舊金山的人工智能研究公司,現由營利性公司OpenAI LP及非營利性母公司OpenAI Inc組成,核心宗旨是“創建造福全人類的安全通用人工智能(AGI)”。OpenAI以大模型為核心開創了AI領域的新一輪創新范式,成為引領通用人工智能的領軍企業,在福布斯“2023云計算百強榜”上位列榜首。
OpenAI最早作為非營利組織,2015年12月由埃隆·馬斯克、美國創業孵化器Y Combinator總裁薩姆·奧爾特曼、全球在線支付平臺PayPal聯合創始人彼得·蒂爾等硅谷科技大亨創立,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。2016年6月,OpenAI宣布了其主要目標——包括制造“通用”機器人和使用自然語言的聊天機器人。同年,OpenAI發布首個產品,即一款開源強化學習工具包——OpenAI Gym和Universe。2017年,“情緒神經元”和OpenAIFive項目的突破,使得OpenAI開始關注大型語言模型和參數規模,實現AGI的信念增強。
2019年,隨著馬斯克的退出以及大模型對資金超乎預期的需求,OpenAI轉向了混合結構,即從非營利性轉變為“有上限”的營利性。在非營利母公司主體下,創建了一個限制性營利實體OpenAI LP,引入了上限利潤模式,上限為投資的100倍,允許OpenAI LP合法地吸收風險投資和員工持股。2019年7月,微軟宣布與OpenAI開展為期多年的合作。微軟成為OpenAI的獨家云供應商和OpenAI新AI技術商業化的首選合作伙伴。微軟的加持使得OpenAI的大模型開發如虎添翼。
2021年5月,OpenAI 宣布成立1億美元的人工智能創業基金,由投資模式轉向孵化器模式。OpenAI通過“資金+技術+戰略”支持的方式,支持優質的AI初創公司;被投公司成長起來后,增加OpenAI產品落地的場景需求和產業知識,從而反哺基礎技術創新。這一模式使OpenAI可以超前把握未來顛覆性技術的機會,并投資布局未來產業,為嵌入未來海量應用場景和指數型、裂變式增長鋪路。
2022年底至今,OpenAI進入快速發展期。2022年11月,OpenAI發布ChatGPT全新聊天機器人模型,這一革命性產品的上線引爆全球,成為用戶破億速度最快的消費級應用,全年營收達到2800萬美元。2023年1月,OpenAI的估值達到290億美元,是2021年的兩倍。ChatGPT服務逐漸向全球覆蓋,已有200萬名開發者使用OpenAI的應用程序接口,92%的財富500強公司使用OpenAI的產品搭建服務,而ChatGPT的周活用戶數也達到1億人。2024年2月16日,OpenAI公布了一種新的人工智能系統Sora(“文字生成視頻”大模型),使其成為第一家采用生成視頻技術的人工智能公司。用戶僅需輸入簡短一句話,Sora就可以生成一段長達60秒的視頻。在Sora發布的同時,OpenAI完成了一項允許員工出售股份的交易,公司估值由此超800億美元,一年內飆升兩倍多。
1.2 融資概況
截至2024年3月,OpenAI已進行了10輪融資,總融資額超140億美元。成立不到十年的時間里,OpenAI的估值就在2024年2月的融資交易中達到了800億美元。
其中,微軟作為其最大的投資者和合作者,先后對OpenAI進行了3次投資,金額達130億美元。2019年7月,微軟與OpenAI建立獨家云計算合作關系,并對其投資10億美元。2021年1月,OpenAI宣布從微軟獲得10億美元的額外投資,并與其簽署了一項長期合作協議,將GPT-3模型作為微軟云計算服務器Azure的獨家許可方,也就是說微軟為OpenAI提供算力支持,OpenAI的所有技術都搭建在Azure云服務器上運行。在2023年4月,OpenAI完成103億美元的新一輪融資,其中有100億美元來自微軟。在兩者的合作中,微軟可以參與OpenAI利潤及股份的分成:在收回投資前,微軟有權獲得OpenAI公司75%的利潤;收回投資后,微軟將持有OpenAI公司49%的股份。此外,微軟還可以將OpenAI的技術整合至旗下搜索引擎必應、營銷軟件、Microsoft 365辦公軟件及GitHub編程工具中,構建AI服務體系。
表1 OpenAI 融資概況
數據來源:Crunchbase、Tracxn
Part 2 商業模式
2.1 市場定位:“安全通用的人工智能”
OpenAI最初設立時的宗旨是“非營利性組織”,而發展到2018年,一份新章程草案將OpenAI未來的發展目標進行了修改,將其調整為“創建造福全人類的安全通用人工智能(AGI)”,這表明企業開始向商業化的方向發展。
2023年,OpenAI又將原先的“大膽”、“深思熟慮”、“樸實無華”、“影響力驅動”、“協作”和“以增長為導向”價值觀替換為“聚焦通用人工智能”、“堅韌不拔、勇往直前”“堅守規?;?、“制造出讓人喜愛的東西”與“團隊精神”,明確將 AGI 列為后續工作的重中之重。
2.2 主要產品
據OpenAI官網顯示,目前其產品主要分為兩類:一類是以應用程序接口(API)為主的產品,其中包括可調用GPT模型、DALL·E模型、Whisper(語音識別模型)和為開發者提供的對話、量化、分析、微調功能;另一類是以ChatGPT對話機器人為核心的產品,分為個人版和企業版。
以上產品包含文本生成、圖像生成以及音頻生成模型,不僅在技術層面達到了行業領先水平,并且在多個應用場景中都展現出了強大的實用性和潛力。
GPT系列文本生成模型
GPT(Generative Pre-trained Transformer)是OpenAI開發的一系列基于Transformer架構的自然語言處理模型。這些模型通過大規模的預訓練,具備了強大的語言理解和生成能力。經過四年半的更新迭代,2023年3月OpenAI 宣布發布GPT-4,能夠接受文本或圖像輸入,能閱讀、分析或生成多達 25,000 字的文本,并能用所有主要編程語言編寫代碼。GPT-4比 GPT-3.5更可靠、更有創造力,而且能處理更細微的指令,在各項最初為人類設計的測試中取得了更高的成績。
圖1 gpt-4與gpt-3.5測試成績比對
(資料來源:OpenAI官網)
DALL-E系列圖像生成模型
DALL-E是OpenAI開發的一款文本到圖像的生成模型。用戶只需輸入一段描述性的文字,DALL-E便能自動生成與之匹配的圖像。這款產品的出現,極大地拓寬了人工智能在創意產業中的應用范圍,為設計師、藝術家等創意工作者提供了全新的創作工具。
圖2 DALL-E功能示意
(資料來源:OpenAI官網)
音樂生成模型
OpenAI在2019年發布了MuseNet產品,這是一個經過訓練的深度神經網絡,用于預測MIDI音樂文件中的后續音符。它可以生成包含10種樂器、15種風格的歌曲。據美國科技媒體網站The Verge報道,MuseNet生成的歌曲往往開頭合理,但播放時間越長就會越混亂。在2020年,網絡心理驚悚片《Ben Drowned》就初步應用了這一工具為片中的人物創作音樂。
2020年,OpenAI上線了Jukebox,這是一種開源算法,用于生成帶人聲的音樂。在對120萬個樣本進行訓練后,系統可以通過輸入流派、藝術家和歌詞片段輸出歌曲樣本。OpenAI 表示,這些歌曲顯示出局部音樂的連貫性,但也承認這些歌曲缺乏大型音樂的結構,如重復的副歌,并且Jukebox與人類生成的音樂之間還存在明顯差距??萍济襟w網站The Verge評論道:“盡管Jukebox生成的音樂聽起來像是熟悉歌曲的乏味版本,但它在技術上令人印象深刻?!?/p>
Sora視頻生成模型
Sora是OpenAI最新推出的一款產品。該系統可以根據用戶輸入的文本內容生成長達一分鐘的視頻,也可將現有視頻向前或向后延展。Sora背后的技術來自于DALL-E3文本到圖像模型技術的改編及升級,并使用公開以及獲得版權的視頻系統進行訓練。
圖3 Sora功能示意
(資料來源:OpenAI官網)
但是當前的Sora模型仍存在弱點。它可能難以準確模擬復雜場景中的物理現象,無法理解具體的因果關系,還可能混淆提示的空間細節,例如混淆左和右,并難以精確描述隨時間發生的事件。
2.3 盈利模式
根據其產品分類,OpenAI產品收費情況如表2所示,主要有兩大收入支柱。
一是ChatGPT誕生以來,OpenAI最依仗的按API調用收費的模式。在該模式下,用戶幾乎可以使用OpenAI所研發的多模態能力,貫穿底層大語言模型、模型部署、模型開發等過程,且價格十分友好,每次調用只需幾美分。OpenAI官方并未具體劃分使用者是個人用戶還是企業,但據外媒報道,除了大量個人用戶外,Jasper、Slack、Salesforce、摩根士丹利等知名企業都是其早期用戶。
在這個收費模式之下,OpenAI還向微軟提供了包括編碼、文氏圖、ChatGPT等多項功能,并嵌入其微軟云服務、搜索、辦公軟件等多款產品中。OpenAI能從中收益幾何尚未可知,但以Azure云業務為例,微軟使用上述OpenAI功能的成本與報價一致,同時,OpenAI的所有技術還在微軟的Azure云基礎設施上免費運行。
二是以ChatGPT產品為主的訂閱收費制。早期OpenAI以免費的方式獲取了大量的客戶及訓練數據,也憑借此,OpenAI在9個月內刷新了TikTok和Instagram的用戶增長速度,成為最快達到1億用戶數的應用。
表2 OpenAI產品及收費標準
資料來源:公司官網
為微軟提供服務、給個人用戶“嘗鮮”并不是OpenAI的最終目的。2023年6月,ChatGPT用戶數在越過峰值后開始出現下滑,OpenAI便開始將經營思路從C端轉向B端。自OpenAI企業級ChatGPT產品推出以來,已被超過80%的財富500強公司團隊所采用,包括Block、Canva、雅詩蘭黛、普華永道等大型企業也已提前試用了ChatGPT企業版的Beta版本。之后,OpenAI也將針對小型機構推出ChatGPT商務版本,并提供更多定制化選項。
OpenAI還致力于構建人工智能生態,采取“月訂閱付費+潛在流量變現”的模式。2023年3月,OpenAI發布了ChatGPT插件集,它能將ChatGPT連接到第三方應用程序。5月13日,OpenAI發布推文稱,將在下周向所有ChatGPT Plus用戶開放聯網功能和眾多插件,將允許ChatGPT訪問互聯網并使用70多個第三方插件。目前開放使用的插件包括酒店航班預訂、外賣服務、在線購物、法律知識、專業問答、文字生成語音等。插件的專業能力和ChatGPT的自然語言人機交互、通用知識庫結合,極大地增強ChatGPT的功能。
Part 3 面臨挑戰
3.1 數據隱私和安全問題
盡管OpenAI致力于安全,但隨著公司所收集數據的增多,這些信息被泄露或濫用的風險也在增加。這可能會導致法律后果以及對公司聲譽的損害。
2023年3月,OpenAI的Redis開源庫中的錯誤導致在ChatGPT服務中暴露了其他用戶的個人信息和聊天標題。在ChatGPT被接連發現意外泄露了用戶聊天記錄后,意大利數據保護局在3月底宣布將暫時禁用ChatGPT并對該工具涉嫌違反隱私規則展開調查。加拿大也對OpenAI“未經同意收集、使用和披露個人信息”的相關投訴進行了調查。
2023年6月28日,美國克拉克森律師事務所向舊金山聯邦法院提交一份厚達175頁的訴訟書,指控“OpenAI秘密從互聯網竊取了3000億個單詞,范圍包括書籍、文章、網站和貼文,以及未經同意獲取的個人信息”。根據訴狀,OpenAI大規模盜取互聯網用戶與該公司產品的互動信息,及集承ChatGPT應用中的隱私數據,并將這些信息用于該公司產品的模型訓練。受害者據稱可能多達數百萬人,潛在損失高達30億美元。
3.2 侵犯版權爭議
2023年12月,《紐約時報》以侵犯版權為由起訴OpenAI及其合作伙伴微軟,指控OpenAI和微軟“試圖搭便車”,非法使用了數百萬篇文章來構建人工智能工具。在一些情況下,OpenAI將《紐約時報》刊登的內容逐字復制,提供給向ChatGPT尋求答案的用戶。隨后,其他幾家數字新聞媒體也進入了起訴OpenAI侵權的行列,指控OpenAI違反了聯邦版權法《數字千年版權法》,因為OpenAI從采用的文章中刪除了作者和標題等版權識別信息。除此之外,還有數名演員、記者、作家以及美國作家協會對OpenAI提出訴訟,稱該公司的大型語言模型參與了“大規模的系統盜竊”。
另外,圖像生成式產品DALL·E 3也面臨版權侵犯的爭議。盡管DALL·E 3會拒絕根據受版權保護的文本提示生成圖像,但對輸入文本稍作修改后,它仍能生成類似的圖像。
人工智能工具的繁榮正在考驗版權法的邊界,內容創作者與人工智能間的版權之爭正愈演愈烈。OpenAI到底是侵犯版權還是合理使用,目前還沒有明確的答案。美媒“Vox”指出,一方面,技術創新的倡導者認為,人工智能技術充滿了希望,最好不要為了過度保護版權而犧牲人工智能訓練的效率;另一方面,媒體及內容創作者堅持,即使是令人驚喜的科技公司在使用受版權保護的內容時也需要付費。
Part 4 行業發展前景
OpenAI 所處的生成式人工智能(AIGC)行業持續蓬勃發展,全球AIGC行業的融資總額在2023年達到了人民幣1902億元,融資次數共計282次,這一數字充分體現了投資者對AIGC技術未來應用前景的強烈信心。
4.1 技術創新與產業融合
區塊鏈、邊緣計算、物聯網、機器學習、自然語言處理、機器人過程自動化、量子計算等新興技術正在迅速改變企業的運營方式。通過利用這些先進技術,AIGC可以開發出更智能的系統,能夠以前所未有的速度和更高的精度執行復雜的任務。
通過不斷地創新迭代,AIGC正在顛覆數字內容的生產方式、傳播形式和消費模式,使消費者的生活發生快速變化。AIGC技術在自然語言處理、計算機視覺和大模型等領域,為各行各業帶來了新的機遇。例如,在游戲開發、影視制作、教育和醫療等領域的應用,AICG展現出了其在提高用戶體驗和企業創收能力方面的顯著效果。
越來越多與AIGC相關的應用被推向了前臺。隨著AI大模型技術的應用場景越來越多,注重結果、深耕業務場景成為了發展的關鍵。也許在未來幾年,AIGC將逐步從泛娛樂場景過渡到支持社會生產的領域。
4.2 產業規模預測與經濟增長潛力
AIGC產業的規模預測揭示了這一領域未來的增長潛力。隨著上游技術的不斷成熟和下游應用場景的不斷拓展,預計AIGC產業將繼續吸引大量的投資和資源。AIGC技術有望為全球經濟貢獻約7.9萬億美元的增長空間,這一預測基于AIGC技術在提高生產效率、降低成本以及創造新的商業模式等方面的潛力。
圖4 2022-2030年生成式人工智能市場規模測算,單位:10億美元
(資料來源:globenewswire.com)
責任編輯:方杰
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。