參賽單位:數庫(上海)科技有限公司
案例名稱:數庫金融風控預警解決方案
案例簡介:
以人工智能驅動金融創新:
1、 智能NLP資訊分析
獨有的NLP和機器學習算法,開創了NLP和圖譜相結合在金融領域商業化智能應用的先河。
2、 專有的企業產業圖譜技術和數據
基于數庫獨特的產業鏈體系,生產出專業高效企業圖譜與產業圖譜數據覆蓋。
3、 提升金融風險預警效率
通過算法與數據智能化完善企業畫像提供風險預警支持
4、 成功的金融場景應用落地
以深度的金融行業洞察力以及高度契合垂直場景的功能模塊,打造強勁的商業化應用。
項目背景:
1、 金融機構在大數據、智能化方向FinTech技術持續投入
2、 企業違約風險加大的背景下,凸顯企業風險管理控制的強烈訴求
3、 大數據時代到來,海量信息處理需求
4、 金融機構降低業務成本、提高運營業績及決策效率需要
創新技術/模式應用:
1、 NLP:自然語言處理(NLP)是計算機科學、人工智能和語言學的交叉領域。目的是讓計算機處理或“理解”自然語言。NLP、機器學習和數據挖掘技術運用于數庫資訊產品(資訊解析、自動摘要和知識獲取等)。
2、 機器學習:機器學習通過從數據里提取規則或模式來把數據轉換成信息。主要的方法有歸納學習法和分析學習法。數據首先被預處理,形成特征,然后根據特征創建某種模型。
3、 數據挖掘:數據挖掘(Data Mining)是采用數學的、統計的、人工智能和神經網絡等領域的科學方法,如記憶推理、聚類分析、關聯分析、決策樹、神經網絡、基因算法等技術,從大量數據中挖掘出隱含的、先前未知的、對決策有潛在價值的關系、模式和趨勢,并用這些知識和規則建立用于決策支持的模型,提供預測性決策支持的方法、工具和過程。
4、 搭建全自動資訊解析平臺,實現端到端全方案服務應用模式:整體架構融合了輿情分析、企業圖譜、產業鏈圖譜等數據應用模式,實現了從非結構化數據生產出結構化數據的應用能力。
解決行業哪些痛點:
解決了行業普遍存在的以下問題:
(1) 資訊獲取和維護成本高昂,信息更新不夠及時。
(2) 針對交易標的(如A股)相關資訊、公告數據分布零散,無法聚焦,無法對新聞中涉及的主體和元素進行分類和識別。
(3) 資訊解讀能力差,專業知識要求高。傳統資訊缺乏人工智能手段對新聞進行正確的解讀,導致任務下沉給用戶,一般用戶缺乏專業知識,往往因誤讀而遭受損失。
執行過程及風險控制:
執行過程:
1、 項目啟動:完成用戶需求調研,形成主體輿情算法專項提升、事件主體要素抽取、新聞與行業關聯、新聞與產品關聯、審計師處罰信息抽取、算法服務容器化改造、數據質檢等7大需求。
2、 項目規劃:項目整體規劃時間為5個月,系統架構采用數據采集層、算法引擎層和數據服務層3個架構。
3、 項目執行:搭建采集平臺進行數據采集;搭建算法管理平臺,進行了算法服務容器化改造,建立smarttag智能標簽,輿情分析、企業圖譜、產業鏈圖譜、事件主體等算法模型。
4、 項目監控:執行項目日常進度管理,定期和不定期的專家評估,使用適當的工具和技術來衡量項目績效,以識別和量化任何偏差,并確定適當的糾正措施。
5、 項目結尾:完成企業主體風險監控、輿情監控應用場景、知識庫及語料庫積累、金融事件風險預警體系、企業圖譜及產業圖譜等成果交付。
風險控制:
1、 建立質量保證體系:建立標準化的質量管理計劃和制度,建立項目質量KPI。
2、 建立配置管理體系:配置專職人員,進行版本管理。
3、 建立度量分析體系:創建符合項目實際的軟件度量指標體系。
4、 建立缺陷管理體系:采用專業的缺陷跟蹤管理系統。
5、 成立專家評審制度:引入專家評審機制。
效果評估:
1、 效率提高:傳統分析資訊每天100篇,系統上線后1000篇。
2、 從無到有:傳統方式獲取到的信息比較零散,系統上線后建立完善的企業標簽庫,進行企業畫像,建立了超過50種關系,補充了非結構化輿情信息。
3、 成本降低:傳統方式單人只能監控20家企業,系統上線后,能夠監控100家企業。
4、 風控能力提高:通過圖譜、輿情、事件、主體,獲取更全面的信息。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。