嘉賓 | 曹駿 騰訊云商業銀行總經理
作者 | 李忠良
策劃 | 高玉嫻
隨著金融行業的不斷發展和數字化轉型的進行,銀行核心系統的重要性日益凸顯。然而,由于歷史原因和技術限制,許多銀行核心系統仍然依賴于國外廠商的技術和產品。為了提高銀行核心系統的自主可控性和安全性,國內銀行開始探索國產化替代的道路。但探索之路漫漫,在 9 月 26 日的 InfoQ《超級連麥·數智大腦》直播中,InfoQ 與騰訊云商業銀行總經理曹駿探討了銀行核心系統的國產化進展與未來。
曹駿表示,在數字化與國產化趨勢下,銀行走向分布式可能是必然的,這一點在業界已經形成了共識。但是,在金融機構中,核心系統的重要性極高。如果周邊系統出現問題,可能只會影響局部,但如果核心系統出現問題,可能導致整個業務停擺。因此,每個銀行機構在進行核心相關的設計時,需要非常小心謹慎。在進行核心系統的重構時,通常會經過數年的時間逐漸完成,以控制風險并逐步嘗試。
具體針對核心系統替代,首先,選擇適合自身戰略的架構是應對核心系統挑戰的關鍵;其次,需要在關鍵的技術組件和部署方式上作出選擇,以應對可能出現的風險;最后,還需要防范系統在上線、調優、測試以及運營過程中可能出現的問題。
以下是對話全文(經 InfoQ 進行不改變原意的編輯整理):
InfoQ:金融行業經歷了哪些決定性的發展階段?在這些階段中,金融機構對于技術的需求又有哪些相應的變化和調整?
曹駿:金融機構在技術發展上經歷了幾個重要階段。首先,金融機構在各自的賽道中有著不同的類型和規模,其中,銀行在整個賽道中規模最大,技術投入也相對較高。
●早期階段:
我從1998年開始從業,最初是幫助一家區域性的銀行建設核心系統。那時,所有的核心系統都是隔離的,不是分布式的。這是中國銀行科技系統的萌芽階段。到了2000年左右,我們進入了被我們稱為“大集中”的時代,國有銀行開始采用IBM的主機,一兩臺機器就可以支撐全國的交易業務。這是一個非常重要的里程碑,標志著銀行在全國實現了通存通取。
●IOE技術階段:
隨著時間的推移,我們進入了更為集中的時代,開始使用IOE的技術,如IBM的小型機,Oracle的數據庫和EMC的存儲來構建銀行的融合型業務系統。在這個時期,很多區域性的銀行開始建立自己的核心系統。
●分布式和國產化階段:
目前,我們面臨著數字化和國產化的雙重挑戰。我們需要對數據有更深更廣的處理,對算力的要求也非常高。我們正在探討是否可以通過國產化的硬件和軟件來支撐新的核心系統。在這個時代,大數據和AI技術得到了廣泛應用,云原生的理念也得到了廣泛應用。
InfoQ:能否進一步追溯并探討一下,銀行在業務端遇到了哪些主要的挑戰,從而觸發了后端這一系列連鎖反應和技術需求的變化?
曹駿:在早期的單核心和集中式時代,銀行系統的主要作用實際上是記賬,確保如存取款、查詢、轉賬等所有交易都能被準確記錄。那時,系統的要求是以盡可能低的成本實現交易的準確性、一致性和穩定性。大集中的架構,如兩臺主要的機器,只要穩定性高,就能為全國提供賬務處理,這種集中式處理方式效率較高,因為所有的賬務都可以在一個地方集中完成,所以集中式的AP架構是最合適的。
但隨著銀行進入移動互聯網時代,為了支持消費互聯網和開放銀行,例如線上支付、搶購、秒殺等,銀行需要記錄用戶的訪問行為,通過這些行為和客戶端數據來提供更個性化的服務和控制風險。這就要求對數據有海量、高效率、高速的處理能力。如果完全依賴集中式的處理流程,設備成本會過高,所以分布式處理方式逐漸被接受。
一個典型的例子是微眾銀行,這家民營銀行的收入和經營效率都非常出眾。它通過分布式的方式,利用低成本的商用服務器和快速網絡來提供業務支持,通過線上交易、線上風控和自動化服務,提供給客戶的服務的經營效率比一般的銀行要高很多。這種分布式形式可以降低成本,提高市場響應效率,獲得更多的發展空間。這也展現了新技術,如分布式、云原生、數字化等,能夠有效提升業務處理能力。為了支持消費互聯網和線上海量業務,性能和并發性要求非常高,越來越多的銀行意識到需要通過分布式的方式來降低成本。加上國產服務器可能不像IBM那樣能使用海量算力,新的算力模式也要求我們走向分布式方向。
除此之外,云計算和敏捷交付技術的發展使得新方向更加高效、靈活,能快速響應市場需求。
InfoQ:雖然分布式已經成為潮流趨勢,但是集中式架構在單體性能等方面仍然具有優勢,尤其對于國有銀行這樣有著高性能、高穩定性要求的行業來說,分布式真的是更好的選擇嗎?還是說在實施過程中存在一個平衡點?
曹駿:在數字化與國產化趨勢下,走向分布式可能是必然的,這一點在業界已經形成了共識。集中式處理在做賬務處理時無疑有其優勢,尤其是當單機算力足夠強時。但這種單機的算力非常昂貴。例如,IBM的主機不是按臺賣的,而是按MIPS來賣的,價格非常昂貴。而新的一些算力形式,如大數據處理,需要海量的算力,并不強調集中式。大數據處理可以通過幾千臺機器來并行處理,而單臺機器很難達到這樣的算力。此外,AI的訓練也是通過分布式的行為來實現的,集中式的算力處理不了。
集中式的優勢主要在于它在某些領域有一定的優勢。但現在,通過分布式微服務等技術手段,新的設計可以達到與集中式相同的穩定度。例如,微眾銀行采用分布式,通過上千個節點來支撐用戶的各種算力,雖然單機可靠性可能并不高,但整體效果是一樣的,可以提供非常高的服務水平。綜合考慮穩定度和價格,我們判斷未來的發展趨勢肯定是走向分布式。
InfoQ:在銀行業中,各機構對于國產化系統的替代進展到什么程度了?
曹駿:我們觀察到,國內的國產化已經推動了三批試點機構,涉及超過150家銀行機構。這150家銀行基本上涵蓋了我國的大中型金融機構范圍。換句話說,主要的銀行都開始進行類似于分布式國產化的工作。
從發展情況來看,主要的銀行應用系統領域基本上都可以進行國產化替代。例如,最難替代的核心系統也在進行國產化。我們預計,在未來一兩年的時間里,國產化會獲得非常大的推廣和推進。至今,無論是大型國有銀行、股份制銀行,還是地方金融機構,都有成功的國產化分布式故障化案例。一些先行者已經完成了國產化過程,未來實際上處于全面推廣和復制的階段,技術上已經得到了驗證。
InfoQ:能否更詳細地闡述一下,應該采取哪些關鍵措施來確保核心系統的穩定性和可靠性?
曹駿:在金融機構中,核心系統的重要性極高。如果周邊系統出現問題,可能只會影響局部,但如果核心系統出現問題,可能導致整個業務停擺。
因此,每個銀行機構在進行核心相關的設計時,都會非常小心謹慎。在進行核心系統的重構時,通常會經過數年的時間逐漸完成,以控制風險并逐步嘗試。
在此過程中,我們觀察到幾個重要的要點:首先,選擇適合自身戰略的架構是應對核心系統挑戰的關鍵;其次,我們需要在關鍵的技術組件和部署方式上作出選擇,這也是一個需要仔細考慮的環節,以應對可能出現的風險;最后,我們需要防范系統在上線、調優、測試以及運營過程中可能出現的問題。
傳統的核心運營方式已經有幾十年的歷史,而新的技術架構可能只有數年的時間,其穩定性和配套機制可能都不如傳統的技術。因此,我們必須留出足夠的時間來進行試錯和糾正。這也是我們需要面臨并應對的風險。
總之,核心系統的復雜性和重要性要求我們在設計和實施過程中必須非常謹慎,選擇合適的技術架構和部署方式,并預留足夠的時間來應對可能出現的問題和風險。
InfoQ:您提到了選擇適合自身戰略和業務需求的架構的重要性,您能否提供一些具體的例子?
曹駿:當我們討論適合自身戰略和業務需求的架構時,首先,要明確銀行的戰略和規模是什么樣的。例如,如果是一家具有國有大行或大型金融機構,那么它會擁有海量的客戶,在這種情況下,我們需要有非常完備的分布式方案來應對業務挑戰,因為處理節點的數量可能會達到幾百甚至上千。
其次,有一些互聯網銀行,如微眾銀行,可能一開始規模不大,但計劃發展得非常大,擁有海量客戶。這種銀行從一開始可能只有幾百萬、一兩千萬客戶,成長到幾個億的客戶時,整個的擴展性就非常高。因此,我們需要根據這樣的業務戰略去做相應的設計,確保在客戶大幅增長的時候,技術架構可以平滑擴展。
然而,如果是一家地方性的金融機構,未來用戶群可能相對穩定,業務量可能會穩中有增,但整體客戶量沒有多大的變化。在這種情況下,我們是否需要花費大量的精力實施復雜的架構,如大型企業的單元化架構,就成了一個值得考慮的問題。如果選擇了不合適的方向,可能會導致事倍功半。
InfoQ:選擇適合的技術組件的標準是什么?這個過程需要注意什么問題?
曹駿:首先,選擇一個可運維、且能夠掌握的架構是至關重要的。 如果這個架構過于復雜,以至于團隊無法掌握,或者經過調整后無法融入現有體系,那即使這個架構再先進,我們也無法將其有效應用。
例如,我們與很多銀行客戶溝通時,他們表達了希望能像互聯網公司一樣,采用多地多中心、多活的架構,但實際上,對于多數金融機構來說,維持兩地三中心的運維最佳實踐是非常值得的。這樣的架構能很好地與我們現有的運維團隊和開發體系結合,易于管理,能快速發揮價值。
因此,這樣的架構或許更適合金融機構。如果我們只是簡單復制一些聽起來很先進的多地多中心架構,可能由于我們缺乏足夠的掌握和運維能力,會出現如成本過高、運維困難等問題。
InfoQ:上線、調優、測試以及運營過程中的風險具體有哪些?如何防范?
曹駿:以系統設計為例,完成設計后,如何實施諸如銀行所需的各項測試工作是一個大問題,因為通常測試工作的量可能會大于開發工作的量。在這個環節,如何深入測試,如何平滑實現上線,以及如何制定應對系統出現問題時的應急計劃,都值得我們積極去考慮和解決。如果這些層面的配套設施不足,就有可能導致一個技術先進的平臺,在實際落地時,無法發揮出良好的效果。
InfoQ:核心系統國產化涉及架構側和數據庫應用側等多個層面的改造,可以說牽一發而動全身,如果出現問題就會導致全行業務中斷甚至癱瘓,根據您的經驗,多個條線之間如何實現有序、穩定地規劃、布局和實施?
曹駿:針對這個問題,我認為主要可以從三個方面去考慮:
●技術架構的明晰選擇
對于技術架構和運營流程的明晰選擇非常關鍵。需要選擇適合于自己銀行的策略和架構,例如標準的微服務架構可能更適合中小型銀行。此外,在分布式體系下,如何實施運維監控,如何設計開發與運維的一體化,都需要全面設計和考慮。
●緊密協同和合作
在實施核心系統時,需要行內相關團隊、部門、核心系統供應商以及平臺提供商等緊密協同和合作。這涉及到如何選擇和定制核心廠商的產品,如何與平臺提供商協同工作,以及如何在銀行內部實現業務和技術部門之間的緊密合作。
●專業項目管理
銀行系統的升級或國產化周期長,組織協同復雜,因此通常會邀請有管理經驗的專業項目管理機構(PMO)來幫助管理整個過程。他們憑借經驗和專業工具,能夠協助銀行在每個環節更加明確地知道應該如何操作,能夠有效降低風險,提升實施效果。
為了確保順利實施,三個方面需要同步進行,這是一個需要全方位、多角度去考慮的問題,每個方面都需要深入探討和精心實施,以確保最終可以達到預期的效果。
InfoQ:國產系統和中間件在升級過程當中,如何平滑過渡,特別是數據庫的替換?
曹駿:現在,越來越多的銀行選擇使用國產化數據庫,這已經成為一個比較普遍的趨勢。事實上,不同規模的銀行都在進行這樣的轉換。例如,騰訊已經協助四大行中的兩家,從Oracle或主機平臺遷移到國產化數據庫。目前,主流系統基本已經完成了遷移工作。在股份制銀行領域,也有多個成功的遷移案例。
從客戶的需求來看,可以將其劃分為兩大類別:
第一類,選擇在替換數據庫的同時進行核心系統的重構。這通常是由于業務上的核心需求,銀行希望更好地響應市場需求,提升數字化能力。一些銀行可能每5到10年會換一次核心系統,在這個節點上,他們會選擇在數字化和擴張的同時,對整個核心組進行重構。對于這一類的需求,市場上的主流應用廠商都有能力進行這樣的遷移工作。
第二類,某些銀行的數據庫或核心系統可能新近部署,但由于國產化的要求,他們需要進行近乎原地的數據庫替換。這種情況下,技術層面會比較復雜,涉及到的流程包括評估、對核心代碼進行改造、進行測試上線等。其中,可能涉及到的技術挑戰如分布式的性能與集中式的差異、分布式的事務開銷等,都需要進行性能優化。不過,通過適當的調優,通常能夠比較平滑地實現替換。
總體上看,行業內主流選擇的是第一種方式,因為大部分金融機構希望在替換數據庫時,不僅實現技術上的替換,還能在業務上獲得收益。
InfoQ: 在分布式架構轉型的過程,有哪些避坑經驗可以分享?
曹駿:首先,選擇技術架構時,必須要與自己的業務發展規模和發展戰略相匹配。不應一味追求先進技術,我們看到一些銀行客戶在實施過程中,可能會有偏離正確方向的傾向,但多數能夠經過討論后回歸正軌,這正是為何在國內核心系統國產化和重構的過程中,很少有失敗的案例,大家都表現得非常慎重。
第二點,我們需要結合業務的發展要求,面向業務價值來進行系統能力的建設。以微眾銀行為例,他們在核心系統集成過程中就非常注重業務發展價值。他們設計的核心系統架構完全是分布式的,能夠快速適應客戶數量的增加,且能夠低成本、平滑地進行擴張,這與他們的客戶發展策略完全吻合。而如果我們在系統建設中只考慮建設本身,而不與業務價值關聯,可能會發現投入產出比并不理想。
第三點,在實施過程中,我們也要充分考慮到可能的困難。比如,分布式架構在調整和運維上與集中式有很大不同。在分布式環境中定位故障會比較困難,性能的優化也是一個需要重點考慮的問題。而在國產化的硬件性能方面,可能會與之前用到的服務器和芯片有所不同,需要一定時間去磨合。因此,建議大家要為這些困難和磨合預留相應的精力、資源和時間。
InfoQ:銀行核心系統替換的經驗,是否可以復制到其他金融領域?
曹駿:銀行業發展與IT依賴度相對較高,并且其技術發展水平通常比較先進。因此,在其它金融賽道中復制和應用特別有幫助。
然而,在實際應用中,我們也觀察到一些顯著的差異:
銀行業的核心系統供應商多樣,而像資管和保險行業的供應商集中度較高,可能大部分應用由同一家提供,這意味著他們的合作對象可能會少一些;
銀行業的業務發展速度相對較快,并且核心系統經常重構。相比之下,其他金融子行業可能更傾向于穩定,他們可能只想更換數據庫或進行小幅擴展,而不是全面重構;
在核心故障化過程中,銀行通常希望完成業務能力的全面升級,而其他行業可能希望以最低代價平滑地替換核心系統。
盡管存在差異,但通過銀行的實踐來驗證技術的成熟度和穩定度是完全可行的。銀行業已經驗證了如原生微服務等多項技術,這些都可以應用到其他系統中去。對于其他金融行業的從業者,將有助于他們更加明晰自己的發展方向,并更有效地實施技術與業務的融合。
(文章來源:機構投稿)
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。