人工智能是否有國界?
華為事件后,作為全球科技競爭的新高地,人工智能領域是否也會面臨“華為之劫”,引發行業反思。得益于豐富的數據以及廣泛的產業界需求,中國AI公司在場景應用上具備得天獨厚的優勢,然而,應用層面的跨越式發展,底層技術框架和基礎產品上卻存在明顯差距。
例如PC互聯網的Wintel聯盟,移動互聯網的ARM+Android,AI的GPU、TensorFlow、Kubernets,這些支撐行業應用、產品和生態的底層基礎,國內公司幾乎都還是“拿來主義”,一旦如果出現安全問題或者斷供,眾多中國科技企業和用戶將面臨“蓋樓沒有地基”的困境。
敲響開源警鐘
在谷歌暫停和華為部分業務合作后,一些從業者發現美國開源代碼托管平臺Github用戶協議里也提及可能受美國出口管制約束,一時間市場開始恐慌。
所謂開源簡單而言是指將技術的源代碼開放出來,讓所有的開發者能夠了解、使用、優化,免去從底層搭建技術。要搭建諸如Linux、Android、TensorFlow等底層操作系統是一個極為耗費人力、時間的巨大工程,需要具備雄厚的技術基礎,選擇開源的技術可以免去底層開發,因此很多開發者都會選擇“站在巨人的肩上”,直接開發應用場景。
在引發行業熱議后,中科院計算所研究員包云崗對12個知名開源基金會、6個常用的開源協議、3個代碼托管平臺進行了調研與分析,最終得出結論:合理的開源基金會管理辦法可以規避美國出口管制。開源許可證關聯的是知識產權,與出口管制無關?,F有常用開源許可證并沒有在知識產權層面上對中國進行管制,但不排除未來會出現將使用范圍限定在美國的開源許可證的可能。
現有Github等代碼托管平臺默認同意遵守美國的出口管制條例和美國法律,因此代碼托管平臺同時受出口管制和司法管轄權的限制,是最大的風險。包云崗強調,長遠來看,中國必須建立開源項目托管平臺,以備極端情況下依然能自由訪問開源項目。
這也敲響了開源警鐘,在人工智能領域,國內科技公司對開源算法框架的依賴程度不亞于芯片。
核心算法缺失
“最大危機不在于代碼協議和托管平臺,而是TensorFlow等開源框架背后強有力的控制者是商業巨頭公司,托管平臺的法律問題隨著時間的推移都可以解決,關鍵在于掌控社區廠商的態度是否中立,廠商主導的開源協議可以禁止其他人用于商業競爭?!钡谒姆妒絼撌既思鍯EO戴文淵告訴第一財經。
據官方數據,2018年TensorFlow基礎架構的下載量已經超過了1000萬次。戴文淵透露,從開源社區下載量來看,約70%的研發機構會使用TensorFlow開源軟件庫。具體到中國市場,約50%的AI公司采用TensorFlow開源算法框架及二次開發作為產品,在人臉識別、語音識別、無人駕駛、自然語言處理等領域進行服務。
戴文淵認為開源的確可以免去底層開發的門檻和寶貴資源,但這種“半成品”背后卻隱藏著巨大風險。
以Android為例,根據GPL協議系統的代碼版權并不屬于某個人和機構,谷歌雖然無權限對安卓系統進行收費,但谷歌可以針對深度植入的移動服務收費以及篩選參與“OHA”聯盟的廠商資格。(谷歌組建的全球性聯盟組織,這一聯盟將會支持谷歌發布的手機操作系統或者應用軟件,共同開發名為Android的開放源代碼的移動系統。)
早在2017年,Facebook的ReactJS是GitHub上最受歡迎的前端框架之一。但Facebook曾修改開源協議,表示要在ReactJS開源庫的授權中加入了專利條款,如果ReactJS用戶起訴Facebook侵犯專利,那么這位用戶的ReactJS授權將被撤銷。
在業內看來Facebook霸道協議背后意在維護自己壟斷地位,對此百度內部要求內部全線停止使用ReactJS,并給出半年時間進行轉型,自研替代方案。在深度學習框架領域堪稱一家獨大的AI開源框架TensorFlow,也同樣面臨在極端情況下的風險?!伴_源代碼協議如何寫受背后控制者的影響比較大?!贝魑臏Y表示。
無獨有偶,早在2016年原百度研究院副院長、深度學習實驗室主任余凱也曾在朋友圈發文呼吁大家避免使用開源框架TensorFlow,他認為TensorFlow成為世界上占統治地位的人工智能開發平臺對世界是危險的。
“盡管這個平臺目前是開源的,但隨著人工智能變得越來越強大,這個系統會變得極端復雜到失去透明度,而且會很可怕的變成全世界數據、計算、硬件、編譯器等的標準制定者,很可能會使得個人、公司甚至國家在人工智能領域的自主發展,最終被一家商業公司所控制?!庇鄤P表示。
AI自主創新可期
事實上,相較于傳統IT,在人工智能產業上中國完全具備自主創新的能力。從深度學習基礎框架層面而言,百度研發了開源開放的深度學習平臺paddlepaddle,商湯科技搭建了Parrots深度學習平臺,第四范式也自主研發了機器學習平臺“先知”。
“TensorFlow這類底層框架,我們是完全有能力自己做出來的?!贝魑臏Y表示。作為當初百度鳳巢系統的創造者之一,其所在的團隊成功上線了全球首個商用的深度學習系統?!笆曛斑€沒有出現Tensorflow、Spark、Kubernets等開源框架,每一行代碼都需要從底層開始寫,就像是打造一輛賽車,每一個部件都是榔頭敲打出來的?!?/p>
戴文淵認為,實際上自研AI底層框架從長遠看是非常值得投入的,自主創新的AI底層框架可以支撐更大的應用和模式創新空間,產業發展也更加牢靠。
而中國市場有很多大場景AI應用,例如百度、今日頭條的信息搜索場景,淘寶的交易場景,以及包括銀行、石油等關乎國計民生的大型企業,這些企業服務的場景中數據量巨大,模型復雜度比國外要高幾個數量級,也需要用更靈活、性能更好的框架來滿足自身市場的需求。
另一個趨勢是,隨著AI應用爆發和摩爾定律的失效,傳統的CPU和GPU的通用計算效能和影響力在逐漸下降,也提供了一個大家同時起步的公平競爭時機。對于目前AI算力的挑戰,戴文淵認為AI所需的算力并非傳統的通用計算,而是專用的AI算力。
AI系統是有“套路”的設計,不像編程語言可以任意編寫,而是具備固定的計算模式,AI在企業的大量場景應用時發現算力不夠用,這不僅僅是買一個更好的CPU、GPU就可以很好解決的,需要通過軟硬一體的優化方案提升計算效率,有效降低AI應用的總擁有成本。
近期其所在的團隊嘗試拿中國純國產服務器,裝上自研軟件和加速芯片進行測試,最終跑出了與美國服務器加上Tensorflow同樣的性能。國產服務器在硬件的性能劣勢,依靠軟件和加速芯片的優勢得到了彌補。戴文淵認為AI時代對于CPU的依賴是在降低的,更重要的是它是由軟件算法驅動的,針對學習框架優化的軟硬件一體設計才是AI所需的算力,這是中國的機會所在。
當然,AI應用面臨的瓶頸不止計算芯片一個方面,在更高的網絡帶寬、更密集快速的數據訪問和存儲等方面同樣需要改進提升的空間?!半S著國內AI軟件和硬件產業鏈的不斷完善,國內AI企業推出從軟件系統平臺到硬件芯片、內存、存儲、網絡的全made by China服務器產品只是時間問題,屆時將真正構建一個完整的AI自主創新生態系統?!贝魑臏Y表示。
責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。