參賽單位:中誠信征信有限公司
案例名稱:AutoML小微企業稅貸解決方案
案例簡介:
AutoML 小微企業稅貸解決方案,該項目是由中誠信征信與山東省城商行聯盟深度合作,為山東省城商行聯盟提供了一整套 AutoML(自動機器學習)小微企業云稅貸解決方案,通過運用以稅務數據為基礎的“N維多源風控數據+1個AutoML 建模平臺+N層稅貸風控模型”的“N+1+N”模式為成員行的云稅貸產品提供風控護航,實現將小微企業的納稅信用轉化為信貸信用,實現以稅定貸、以稅管貸、以貸促稅、稅貸促信的良性循環,有效發揮了數據價值,解決了小微企業融資難問題。
項目背景:
互聯網金融的高速發展拉動金融創新步伐,國家監管部門陸續出臺多項促進人工智能、“銀稅互動”推動小微企業、民營企業發展的政策,并要求銀行業金融機構嚴控金融風險,我國金融機構都在積極探索通過業務合作模式創新、實現智能業務風險管控的新路徑,為小微企業提供高質量的金融服務,解決小微企業融資難問題。
創新技術/模式應用:
? 小微企業稅貸融資新模式
通過將稅務數據、多維征信數據與機器學習平臺、技術相結合,構建多層級云稅貸模型,有效落實“銀稅互動”政策。
? 多源異構數據匯聚、關聯技術
多源征信數據抽取、轉換和加載,建立數據處理規則和元數據管理規則,實現多源數據匯聚的一體化配置。對多源數據建立粒矩陣,通過基于粒矩陣的邏輯簡約運算獲得動態征信大數據的約簡屬性集,實現數據的多維關聯分析。
? AutoML智能建模
基于數據元變量提取->特征工程->選擇算法組合->調整參數擬合模型->模型檢驗和迭代優化->模型部署的工作流程,形成建模流程的閉環自動迭代,解決復雜關系數據的建模分析難的問題,通過專利算法 PU_learning 提升了最終對于正樣本的搜索正確率,改進了內部閾值及基分類器,并按照符合業務實際的策略進行模型融合與風險校準,實現更準確的風險評估。
解決行業哪些痛點:
(城商行聯盟)一是積累了來自下轄41家成員行、政府部門(如稅務局)及第三方征信公司的大量數據,迫切需要將數據加以有效利用,發揮數據價值;
二是亟需解決如何在做好小微信貸風控的前提下,更好地利用多維數據、專家經驗、先進技術來實現小微信貸業務的線上化、自動化和智能化,創新產品形態切實解決小微企業融資難問題;
三是如何與外部公司合作,發揮各自優勢,實現降本增效。
執行過程及風險控制:
“N+1+N”解決方案主要包含三部分:
(一)N維風控數據接入與處理
表1- 數據接入維度與輸出模型圖
以小微企業稅務數據為核心,引入與金融強相關的聯盟成員行數據、人行稅務等政府部門數據、第三方征信公司的企業和個人數據等共50余個數據字段。既拓展數據維度,又緊密結合申請人的企業運營情況,充分挖掘數據并解讀業務價值,在企業主、企業、行業間建立關聯,通過區分存量客戶和新申請客戶,更加全面、精準的量化風險。
(二)1個AutoML建模平臺部署
圖2- 萬象智慧AutoML建模平臺功能圖
中誠信征信通過自主研發的萬象智慧AutoML自動機器學習建模平臺,支持CcxSocreCard、CcxRF、CcxXgboost、CcxGBM、CcxGBDT、CcxAdaboost、DNN、PU_learning(中誠信征信專利算法)等8種算法集成模型,充分挖掘案例中多源異構數據的關聯,基于“數據元變量提取->特征工程->選擇算法組合->調整參數擬合模型->模型檢驗和迭代優化->模型部署”的工作流程, 形成建模流程的閉環自動迭代。采用的專利算法解決了金融領域只存在正樣本的業務問題,使得輸出的模型更加適用于聯盟業務需求的實際現狀。
(三)N層稅貸風控模型及流程構建
圖3- 小微企業云稅貸風控流程圖
中誠信征信結合山東省城商行聯盟成員行的業務發展方向、現有客群與數據的匹配情況,針對不同客群采用AutoML自動機器學習建模平臺構建多層級模型。模型分為若干個層級進行彼此關聯,并按照符合業務實際的策略進行模型融合與風險校準,最終輸出申請人信用綜合評分,作為授信額度測算的依據。大幅提升其稅貸產品的數據處理及數據分析能力,實現更加精準的評估風險。
中誠信征信與山東省城商行聯盟聯合的AutoML小微企業云稅貸解決方案的創新既包括模式創新又包括技術創新,主要如下:
通過將稅務數據、多維征信數據與機器學習平臺、技術相結合,構建多層級云稅貸模型,為山東省內41家城商行小微企業網貸業務提供風控支撐,有效落實“銀稅互動”政策,有效促進當地小微企業、民營企業發展,助推社會信用體系建設。
1. 多源異構數據匯聚技術:通過ETL、數據稽核、數據存儲及數據治理,進行分布式實時數據同步框架及處理,以及多源征信數據抽取,轉換和加載,建立數據處理規則和元數據管理規則,實現多源數據匯聚的一體化配置。
2. 多源異構數據關聯技術:通過網格搜索、隨機搜索和貝葉斯優化3種參數尋優方法,以及連續型變量分箱和離散型變量分箱2種變量分箱方法,對多源數據建立粒矩陣,通過基于粒矩陣的邏輯簡約運算獲得動態征信大數據的約簡屬性集,實現數據的多維關聯分析。
3. 多源異構數據存儲技術:通過面向離線數倉和實時數倉的數據安全存儲框架,列式NoSQL存儲模式以及反向索引/時間序列索引技術,實現支撐復雜征信計算的高性能,低延遲數據存儲。
(三)AutoML自動機器學習建模技術
基于數據元變量提取->特征工程->選擇算法組合->調整參數擬合模型->模型檢驗和迭代優化->模型部署的工作流程,形成建模流程的閉環自動迭代,解決復雜關系數據的建模分析難的問題,進而有效識別網貸過程中的風險行為,同時有效縮短建模周期,降低成本。
采用平臺的特征組合和算法衍生兩種特征提取方法,通過基于遺傳算法原理的符號回歸方法實現自動特征提取,并基于GBDT算法利用新得到的葉子結點作為新的特征。
(五)PU_learning機器學習算法技術
通過專利算法PU_learning提升了最終對于正樣本的搜索正確率,改進了內部閾值及基分類器,解決了金融領域只存在正樣本的業務問題。PU_learning更具有泛化能力,輸出的模型更加適用于金融領域的實際生產。
采用若干個子層級進行彼此關聯,并按照符合業務實際的策略進行模型融合與風險校準,最終輸出申請人信用綜合評分,作為授信額度測算的依據,實現更準確的風險評估。
本案例結合山東省城商行聯盟的運營現狀,響應聯盟面向所有成員行金融機構打造“網絡互通、信息共享、安全穩定、便捷高效”稅貸系統的需求,充分利用多維度數據對小微金融網貸業務實現精準的風險識別及貸前風險控制。達到很好的應用效果和價值:
一是通過萬象智慧AutoML自動機器學習建模平臺服務聯盟及成員行近萬人,有效地提高了建模的準確率和效率,相比傳統人工建模周期縮短一半以上,極大地節省人了力成本。
二是應用機器學習風控模型的云稅貸產品上線后,服務41家成員銀行,服務覆蓋山東、陜西、浙江、江蘇、山西、河北、河南、天津等八省市的近萬家小微企業,發放貸款金額過億元,且違約率不超過2%,小微金融風控能力顯著提高。
三是利用機器學習技術盤活價值,實現新舊動能轉換,通過金融科技賦能城商行智能風控,案例的“N+1+N”模式可在全國130多家城商行推廣、復用或借鑒。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。