作者單位:興業銀行股份有限公司南京分行法律與合規部
摘要:新的洗錢犯罪手法不斷出現,洗錢行為隱蔽性更強。犯罪分子大多通過跨機構、跨行業交易實現非法所得的合法化,給商業銀行洗錢風險管理提出了新的挑戰。同時,隨著大數據的不斷發展,重視數據隱私和安全已經成為世界性趨勢,法律法規關于數據安全的要求日趨嚴格,加上行業競爭等原因,導致數據信息以“孤島”的形式存在,不同行業、機構間的數據不能充分共享和挖掘。商業銀行基于自身所掌握的“片段”信息很難有效挖掘洗錢風險。
本文通過介紹商業銀行如何借助聯邦學習技術實現跨行業、跨機構的數據安全共享,對洗錢行為數據進行全鏈路的資金流動分析和關聯分析,充分挖掘數據的潛在價值,在解決數據隱私安全的同時,精準識別洗錢行為,構建更加完善的反洗錢管理機制,實現對洗錢風險的高質量管理,降低監管成本,維護國家金融穩定。
關鍵詞:反洗錢、聯邦學習、數據安全、隱私計算、商業銀行
近年來,新的洗錢犯罪手法不斷出現,洗錢行為隱蔽性更強,商業銀行也在不斷提升自身洗錢風險監測水平。從以專家規則、數據排查等傳統的反洗錢監測手段向依托大數據、人工智能等新興技術的反洗錢監測手段轉變。銀行通過對自身擁有的海量、多維度的客戶數據進行分析挖掘,有效提高了客戶洗錢風險識別的準確性。但是,在洗錢活動的放置階段、分層階段和整合階段[1]中,非法資金合法化的過程通常涉及多家金融機構及非金融機構,完整鏈路的數據很少只存在于單一機構。
另外,由于《個人信息保護法》《數據安全法》《網絡安全法》等國家法律法規關于數據安全的要求及行業競爭的存在,各機構普遍拒絕或不敢開放共享自身數據,客觀上加劇了“數據孤島”現象。因此,利用現有的技術手段很難實現在充分保護數據安全、隱私安全的情況下,實現數據跨機構共享分析,給商業銀行洗錢風險管理帶來了巨大挑戰。根據聯合國相關部門的數據統計,每年通過全球金融系統洗錢的金額高達8000億至2萬億美元,我國銀行業反洗錢誤報率則高達95%[2]。
在此背景下,聯邦學習由于其各參與方無需共享原始數據資源即可建立機器學習模型,各參與方可以在保護數據隱私、滿足合法合規要求的前提下,解決“數據孤島”問題,使得商業銀行及監管部門可以應用聯邦學習技術,實現不同行業、不同機構的數據安全共享,更加全面地了解可疑賬戶間的關聯關系、交易時序及資金流向情況,實現對洗錢行為的精準識別,降低樣本誤報比例。
本文擬通過介紹聯邦學習技術,探索商業銀行如何應用聯邦學習技術提高洗錢風險管理水平。另外,通過對聯邦學習技術本身的安全性和通用性的分析,指出大規模應用可能存在的問題。最后,為推動聯邦學習的大規模應用,持續提升商業銀行洗錢風險管理質效,提出相應的建議。
一、聯邦學習技術介紹
(一)聯邦學習定義
聯邦學習(Federated Learning,簡稱FL)也稱為隱私保護機器學習,是隱私計算的核心技術,其起源于Google在2016年提出的在不集中用戶數據、保障用于隱私的情況下,實現谷歌輸入法的智能預測功能。應用聯邦學習,各參與方無需共享原始數據資源,而是只傳輸機器學習模型的梯度信息或參數等中間計算結果,進行信息交換、模型聚合,從而實現擁有不同數據源的各方聯合建模,充分挖掘數據價值,實現了數據“可用不可見”的安全流通。聯邦學習的建模效果和將整個數據集放在一處建模的效果一致或相差不大[3]。
(二)聯邦學習分類
按照架構分類,聯邦學習可以分為有中心服務器的聯邦學習(服務器-客戶端架構)和無中心服務器的聯邦學習(對等網絡架構)。有中心服務器的聯邦學習即各客戶端是獨立的數據擁有方和模型訓練方,中心服務器是模型分發方和進行安全聚合計算的一方,大致流程為:中心服務器向各個客戶端發送具體任務的模型參數;各客戶端收到模型參數后,在本地利用自己的數據進行訓練,并把模型梯度信息發送給中心服務器;中心服務器收到各方的信息,并對其進行安全聚合運算,完成一輪模型參數迭代;如此進行多輪迭代,最終獲得一個優質的全局模型(圖1-a)。無中心服務器的聯邦學習安全聚合是由各客戶端之間通過通信交換信息,自行進行聚合運算,各客戶端必須提前商定發送和接收模型參數信息的順序(圖1-b)。
按照合作的數據特點分類,聯邦學習可以分為三類[4]。一是橫向聯邦學習(horizontal FL),通過增加樣本數量的方式獲得高質量模型的方法,數據合作方的數據具有特征重疊較多、樣本重疊較少的特點,適用于同行業間的合作(圖2-a);二是縱向聯邦學習(vertical FL),通過增加樣本特征維度的方式獲得高質量模型的方法,數據合作方具有樣本重疊較多、特征重疊較少或不重疊的特點,適用于跨行業間的合作(圖2-b);三是聯邦遷移學習(federated transfer learning)[5],應用于樣本和特征均重疊較少的情況下,利用遷移學習技術來學習不同數據集的“知識”的方法(圖2-c)。
(三)聯邦學習主要框架
目前業界已經有幾個較為成熟的聯邦學習開源框架,主要是微眾銀行的FATE框架、谷歌的TensorFlow Federated框架、百度的PaddleFL框架、OpenMinded的Pysyft框架,各框架的主要特性對比如下[6]:
二、聯邦學習在商業銀行洗錢風險管理中的應用場景
商業銀行在洗錢風險管理中應用聯邦學習技術,可以打破數據壁壘、實現數據的“可用不可見,可控可計量”的安全共享,同時全流程可驗證、可追溯、可解釋、可審計、可監管,為構建基于人工智能和大數據的洗錢風險管理體系夯實基礎,對洗錢風險防控有重要的積極意義。本章將從洗錢風險管理的應用場景角度,具體闡述聯邦學習在商業銀行洗錢風險管理中的應用價值。
(一)聯邦學習在可疑交易甄別中的應用
目前,商業銀行通過專家規則、數據排查等傳統方式及人工智能、大數據等新興技術對自身積累的海量、多維度的高質量、高價值的客戶數據進行分析,識別客戶風險和可疑洗錢活動,具體監測流程如下所示(圖3):
圖3 商業銀行當前可疑交易甄別流程
由于在洗錢活動的各個階段中,非法資金在合法化的過程通常涉及多家金融機構及非金融機構。從整個資金的流通過程來看,仍然存在“數據孤島”現象,商業銀行單純地對本機構積累的數據信息進行分析,不能全面地掌握非法資金流通的整個鏈路,不能全方位地掌握人物關聯關系、賬戶關聯關系、交易時序及資金流向等,難以有效識別洗錢行為,進而導致可疑案例的誤排除或誤上報。
根據中國人民銀行發布的《銀行業金融機構反洗錢現場檢查數據接口規范(試行)》(銀發〔2017〕300號)、《金融機構大額交易和可疑交易報告管理辦法》以及中國銀保監會發布的《銀行業金融機構監管數據標準化規范(2021)》(EAST5.0)要求,各商業銀行所保存的數據要素標準基本一致,即數據特征維度重疊較多,可以應用橫向聯邦學習技術,各自在本地訓練模型,并通過同態加密技術和協議進行參數交換,從而構建一個共有的聯合模型,實現在保護本機構客戶隱私、原始數據不出本地的前提下,合法合規地從多源數據中訓練出更加準確的反洗錢可疑交易監測模型,進一步提升商業銀行洗錢風險管理質效,以有中心服務器的聯邦學習技術構建可疑案例監測模型為例(圖4):
圖4 聯邦學習在可疑交易甄別中的應用
(二)聯邦學習在客戶身份識別中的應用
客戶身份識別、客戶身份資料和交易記錄保存以及大額和可疑交易報告是反洗錢的三大核心義務??蛻羯矸葑R別要求商業銀行在各業務環節,秉持“了解你的客戶”(KYC)的原則,對客戶信息、身份資料等進行審核,以確定客戶真實身份,并登記有關身份信息。在客戶身份識別過程中,商業銀行經常需要查詢運營商、工商信息等。商業銀行大多采用將客戶身份信息通過網絡傳輸給第三方,第三方進行數據匹配,并反饋結果,這樣客戶具體去哪些商業銀行辦業務就可能被第三方記錄。第三方可能會利用這個數據對客戶做進一步分析,導致客戶隱私的泄露。商業銀行也可能應用哈希算法,通過客戶信息的哈希值進行密文碰撞的技術手段,可在較低程度上保護客戶隱私,但哈希值對確定格式的數據是可以反向推測原文的,無法充分確保數據安全。
本文以客戶實名認證為例,客戶來商業銀行辦理業務,商業銀行在對客戶身份識別過程中,可利用聯邦學習技術進行客戶實名認證,可以實現隱私保護的效果,商業銀行將要驗證的客戶身份信息通過本地模型處理后,與運營商通過本地模型處理后的數據,利用聯邦學習中的聯合模型進行處理,商業銀行得到聯合模型處理后的結果,最終實現客戶的實名認證。這樣,商業銀行不知道運營商除被查詢客戶的以外數據,運營商也不知道商業銀行所查詢的數據,實現了客戶信息不被第三方了解和儲存的功能(圖5)。
圖5 商業銀行客戶身份識別(實名認證)
(三)聯邦學習在反洗錢模型共享中的應用及激勵機制建立
我國商業銀行可以細分為政策性銀行、國有商業銀行、股份制商業銀行、城市商業銀行、農村商業銀行、村鎮銀行等。不同類型的商業銀行反洗錢模型建設能力差別很大,一般大型國有商業銀行和股份制商業銀行的反洗錢模型建設能力要高于城市商業銀行和農村商業銀行,洗錢犯罪分子往往也了解這種情況,更傾向于通過洗錢風險管理能力較弱的商業銀行清洗非法資金。
如果某國有銀行的反洗錢模型建設能力更強,對可疑交易識別的有效性更高,而某農村商業銀行反洗錢模型建設能力較弱。農村商業銀行想復用國有銀行的反洗錢模型,但出于數據保護的考慮,不能讓國有銀行知道自身數據,而國有銀行擔心模型規則泄露,亦不同意將自建的反洗錢模型部署到農村商業銀行。此時,可以應用聯邦學習技術,農村商業銀行將自身數據通過同態加密技術或安全多方計算技術加密后,傳輸給農村商業銀行,國有銀行應用自建反洗錢模型進行處理,并將結果加密后傳輸給農商行,農村商業銀行解密后進行應用,這樣就可以保證農村商業銀行有效應用國有行的反洗錢模型,但是自身數據不被國有行知道,共享反洗錢模型示意圖如下(圖6):
圖6 反洗錢模型共享
通過以上例子,可以建議建立共享反洗錢模型激勵機制,針對開發能力強、反洗錢模型效果好的機構,可以通過聯邦學習技術向其他機構共享自己所研發的模型的使用權,并設計合理的收費機制。這樣反洗錢模型研發能力較弱的商業銀行可以花費較少的成本提升自身的洗錢風險管理能力,研發能力強大的商業銀行則可以獲得中間收入作為激勵。
(四)聯邦學習在洗錢風險管理中其他方面的應用
近年來,反洗錢管理日趨嚴格,國家及監管層面政策頻出,2022年中國人民銀行、公安部等11部門聯合印發《打擊治理洗錢違法犯罪三年行動計劃(2022-2024)》,在全國范圍內開展打擊治理洗錢違法犯罪三年行動,足以體現出國家層面對洗錢風險管理的重視程度。未來洗錢風險管理的手段和措施也會不斷豐富和完善。本文認為在以下幾個方面也可以應用聯邦學習技術提高商業銀行洗錢風險管理的有效性。
一是聯邦學習應用于客戶洗錢風險等級評定。商業銀行一般通過定性分析和定量分析兩種方式對客戶進行洗錢風險等級認定。在定性分析過程中,可通過應用聯邦學習實現法院、公安機關、監察機關、國安機關、海關、稅務機關等數據與商業銀行數據的跨機構應用,使得商業銀行在對客戶進行洗錢風險評級過程中及時發現客戶已經存在的相關風險,提高客戶洗錢風險評級的準確性。
二是聯邦學習應用于客戶盡職調查。商業銀行一般對產生預警案例的客戶采取盡職調查措施、對系統評級為洗錢高風險等級的客戶采取強化盡職調查措施。在對客戶盡調的過程中,商業銀行可通過應用聯邦學習,實現工商信息、戶籍信息、運營商信息的跨機構共享應用,確??蛻羯矸葑R別信息的全面性和準確性,提高客戶盡職調查質量。
三是聯邦學習應用于外貿行業洗錢行為識別。外貿行業是洗錢高風險渠道,可以通過高報進口價格及預付貨款名義將資金從境內轉移到境外。這是一種典型的向境外洗錢的手法。所以,對外貿相關交易,商業銀行應該有效辨明虛假貿易或虛假價格、識別客戶信息及關聯企業、審核貿易外匯收支情況、核實海關報關單、分析賬戶交易情況等。應用聯邦學習可實現商業銀行數據、工商數據、外匯管理局數據、海關數據的有效共享挖掘,及時發現通過外貿交易的洗錢行為。
三、聯邦學習大規模應用面臨的問題
根據目前研究現狀,聯邦學習能夠實現跨行業、跨機構的數據安全融合,提高商業銀行反洗錢管理質效,但考慮到若大規模應用聯邦學習技術,仍然存在一些問題,主要表現在以下幾個方面:
(一)技術復雜,安全上存在一定的風險。聯邦學習的原理和框架都比較復雜,由于要實現跨域數據傳輸和大量使用密碼學算法,使用性能存在一定的壓力。同時,應用聯邦學習技術,在模型輸出及部署過程中,可能遭受模型更新攻擊、數據攻擊、逃逸攻擊等[7],存在一定的安全風險。
(二)尚未形成完整的解決方案。數據安全需要端到端的全流程防護,從客戶的授權、數據采集、存儲、流通、融合、應用的全流程,都是需要防護的,目前聯邦學習主要集中在數據融合環節,對于數據流通的整個流程尚未形成一套完整有效的方案,沒有確定的標準可以參考。
(三)應用推廣困難。目前國家層面、監管層面尚未對隱私計算相關技術的推廣應用出臺相應的法規政策,不同行業、不同機構大多還是處在嘗試階段,很多機構對新技術的應用處于觀望狀態,不敢真正的將自身擁有的數據通過聯邦學習技術對外開放應用。
四、建議與展望
國家已經明確數據作為一種新型的生產要素,國務院印發《“十四五”數字經濟發展規劃》、國家發改委等9部門發布《關于推動平臺經濟規范健康持續發展的若干意見》,鼓勵基于平臺的數據要素融合創新,促進數據高效合規流通使用;人民銀行印發《金融科技發展規劃(2022-2025年)》,將“推動數據有序共享”、“深化數據綜合應用”作為新時期的重點任務,要求探索實現跨機構、跨地域、跨行業數據資源的有序共享??梢?,國家層面、監管層面已經在逐步推動跨機構的數據共享。
本文認為,聯邦學習技術可以作為一種有效手段實現跨機構的數據應用,提高數據在洗錢風險管理以及其他方面的共享應用。但是,在聯邦學習真正大規模應用于洗錢風險管理之前,還需要對以下幾個方面進行完善。
(一)持續開展技術研究
針對聯邦學習技術的復雜性及安全性問題,商業銀行應持續開展相關技術研究,對基于聯邦學習的洗錢風險管理平臺的底層安全技術進行規范和認證,對不同場景的功能明確相應的安全參數,用以規避技術安全性不明確導致的數據安全隱患,探索如何基于聯邦學習技術最大化的提高洗錢風險管理質效。
(二)建設行業技術標準和平臺
由監管部門或監管部門指定的商業銀行建設統一標準的基于聯邦學習的洗錢風險管理平臺,奠定大規模應用基礎。在底層數據方面,明確可使用的數據范圍、數據標準及數據要素含義等;在技術層面,明確不同場景或條件下的可用算法和協議、性能、安全標準;在管理層面,明確平臺的使用說明、接入流程及應用費用、建立完善的認證、授權、審計機制。
(三)加強政策指導和推動力度
國家層面出臺相應的政策,明確各政府機構的數據可以基于聯邦學習技術,在確保數據安全的前提下應用于商業銀行洗錢風險管理,并制定可共享數據范圍、數據標準等;中國人民銀行作為反洗錢行政主管部門,發布相應的規章制度,鼓勵商業銀行探索基于聯邦學習技術的洗錢風險管理的場景應用,建立相應的監管體系,推動商業銀行積極主動應用聯邦學習技術。
參考文獻:
[1]約翰 馬丁格著,馮道康等譯.洗錢—刑事偵查員指南(第三版)[M].中國人民公安大學出版社.2019.
[2] 21世紀經濟報道,反洗錢任重道遠:行業平均誤報率仍有95%,AI算法還在探索期,2020-3-25.
[3]北京金融科技產業聯盟,隱私計算技術金融應用研究報告,2022-02.
[4]Liu Y,ChenT,YangQ.Secure Federated Transfer Learning[J].arXivpreprint,arXiv:1812.03337,2018.
[5]中國工商銀行大數據與人工智能實驗室,基于遷移學習技術的反洗錢建模研究和實現[J],中國金融電腦,2020(10).
[6]微眾銀行,聯邦學習白皮書V2.0,2020-04.
[7]陳琨、李藝等,聯邦學習在金融行業的應用分析,征信,2021年第10期.
文章系作者投稿,文中內容不代表就職單位和中國電子銀行網觀點和立場!
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。