<listing id="lnlbz"></listing>

<address id="lnlbz"></address>

<form id="lnlbz"><th id="lnlbz"><listing id="lnlbz"></listing></th></form>

<form id="lnlbz"></form>

<progress id="lnlbz"><nobr id="lnlbz"></nobr></progress>

<address id="lnlbz"><sub id="lnlbz"><menuitem id="lnlbz"></menuitem></sub></address>

<listing id="lnlbz"><font id="lnlbz"><cite id="lnlbz"></cite></font></listing><thead id="lnlbz"></thead><rp id="lnlbz"></rp>

移動端

訪問手機端

官微

訪問官微

數字金融 DeepSeek 隱私計算數字人民幣網絡支付金融AI 區塊鏈金融云物聯網金融安全銀行業數字金融創新成果展 Bank幫全部

- 搜銀行
- 數字金融
- DeepSeek
- 隱私計算
- 數字人民幣
- 網絡支付
- 金融AI
- 區塊鏈
- 金融云
- 物聯網
- 金融安全
- 快訊
- 招聘
- 會議
- 江湖
- 理財
- 福利匯
- 金視點
- 專題
- 專欄
- 宣傳年
- BANK幫
- AI播報
- 銀行業數字金融創新成果展
- 全部

取消

熱搜詞

這個入門級AI項目讓90%的程序員一看就會！

程序人生來源：csdn 2018-11-23 10:48:22 AI 入門金融安全

程序人生來源：csdn 2018-11-23 10:48:22

AI 入門

金融安全

核心提示隨著AI的發展，美國橡樹嶺國家實驗室的一些專家預測，到2040年，AI技術將會強大到足以替代程序員。AI技術將會強大到足以替代程序員，AI編寫軟件將比人類程序員更好、更快。換句話說，軟件編寫的軟件比人類編寫的更好。

　　隨著AI的發展，美國橡樹嶺國家實驗室的一些專家預測，到2040年，AI技術將會強大到足以替代程序員。AI技術將會強大到足以替代程序員，AI編寫軟件將比人類程序員更好、更快。換句話說，軟件編寫的軟件比人類編寫的更好?！　?/p>

　　這是怎么發生的？AI能真正學會如何做需要高度創造性的智力工作嗎？畢竟創造性一直被認為是人類特有的。AI能學到的東西會比我們教它的更多嗎？

　　穩住，別慌今天本文將分享一篇AI入門實戰的項目經驗分享，專門為對于沒有動過手的同學準備，以此來啟發新手們如何開動，了解AI技術~

　　漢字書法識別入門

　　前段時間參加了一次TinyMind舉辦的漢字書法識別挑戰賽，說是挑戰賽其實就是一場練習賽。為一些剛剛入門的同學和沒有比賽經驗的同學提供了一個探索圖像識別領域的平臺。我目前是暫列榜首（沒想到轉眼就被超越了-。-），所以把自己的思路和想法稍微做一個分享，給有需要的人提供一個base line。

　　先來看數據集~~

這個入門級AI項目讓90%的程序員一看就會！

100個漢字的訓練集

這個入門級AI項目讓90%的程序員一看就會！

10000張書法圖片的測試集

　　上面的訓練集總共有100個漢字，每一個漢字都有400張不同字體的圖片，數據量上來看算是一個比較小的數據集。

　　等等，看到的確定是漢字嗎，第一眼望過去我是真的emmmmm.....甲骨文，篆體各種字體都冒出來了。先喝口水冷靜一下，仔細看一看發現圖片都是gray的。想了一想突然覺得這個和mnist并沒有太大的區別只是字體更加復雜一些，可能要用稍微深一點的網絡來訓練。

　　圖片看完了，那么開始擼代碼了。分析終究是分析，還是實踐才能說明一切?！　?/p>

　　數據集劃分

　　競賽中只給了train和test，所以需要自己手動劃分一個val來做模型訓練的驗證測試。在這里簡單說明一下經常用的兩種劃分數據集的方法。

　　本地劃分

　　內存劃分

　　本地劃分：圖片是按照文件夾分類的，所以只需要從每個文件夾中按ratio抽取部分圖片到val中即可，當然不要忘記了shuffle。

　　內存劃分：把所有圖片和標簽讀進內存中，存為list或者array然后shuffle后按長度劃分。前提是把數據讀進去內存不會爆炸掉。內存劃分只適合小型數據集，不然會Boom!!!

　　注：劃分數據集的時候一定要打亂數據，shuffle很重要?。?！

這個入門級AI項目讓90%的程序員一看就會！

　　注：這里只給出部分代碼，文章最下面github有完整鏈接?！　?/p>

這個入門級AI項目讓90%的程序員一看就會！

　　注：這里引用dwSun的linux shell腳本，如果想用簡單腳本實現也可以采用他的代碼~

　　模型建立與數據預處理

　　對于CNN網絡來說，大的數據集對應大的訓練樣本，如果小的數據集想要用深層次的網絡來訓練的話，那么必不可少的一步就是數據增強。

　　數據增強的大部分方法，所有深度學習框架都已經封裝好了。這里我采用的是keras自帶的數據增強方法。

這個入門級AI項目讓90%的程序員一看就會！

　　由于漢字是具有筆畫順序的，所以做了翻轉以后訓練的效果不是很好。這里就做了一個寬度和高度的偏移，由于給的數據集圖片長寬不是固定的而且字體的內容也是有長有短。所以用這兩種增強方式可以提高模型的準確率，結果測試這兩種方式還是有效的。

　　數據處理完了，那么下面就是我們可愛的CNN網絡模型了

這個入門級AI項目讓90%的程序員一看就會！

cnn一把梭

　　嗯，就是干。

這個入門級AI項目讓90%的程序員一看就會！

　　這里用了6個簡單的卷積層，和PRelu+bn層?！　?/p>

　　下面是一個比較大的模型ResNet50，模型是已經merge在了keras的applications中，可以直接用。不過需要調整分類層。

這個入門級AI項目讓90%的程序員一看就會！

　　好了，煉丹爐有了接下來就是你懂的?！　?/p>

　　訓練模型

　　訓練模型和調參真的是一個技術活，這里我跑了共40個epoch。思路只有一個那就是先把train的數據跑到loss下降并且先過擬合再說。只要過擬合了后面的一切都好調整了，如果訓練數據都不能到過擬合或者99以上那么要仔細想想數據量夠不夠和模型的選擇了。

這個入門級AI項目讓90%的程序員一看就會！

loss

這個入門級AI項目讓90%的程序員一看就會！

acc

　　可以很清楚的看出來，訓練數據集已經過擬合了。我用的優化器是sgd，學習率設置的是lr=0.01。val_acc可以跑到了0.94左右，這是一個比較正常的訓練水平。還可以進一步的提高?！　?/p>

　　提高方法

　　數據增強：采取其他的數據增強方法進一步擴大訓練數據，這里可以采用GAN來生成近似于真實圖片的數據。

　　衰減學習率：當到達一定epoch的時候，loss不再下降了這個時候可以通過減小學習率的方法進一步訓練。

　　模型融合：模型融合的方法在大部分數據集上都會有所提高，這個是最常用的一種競賽方式。

　　以上就是我自己做的流程和思路，提交結果和評測的代碼寫在我的github上面了，有興趣參加比賽練手的同學可以參考一下。

　　github地址：https://github.com/FlyEgle/chinese_font_recognition/

　　好多小伙伴是從開發或者是其他工程上轉到AI的，所以下面我給有需要的同學列舉出一些必要的基礎知識點：

　　數學：線性代數和概率論是必須要會的，而且基本的概念和計算都要懂?？梢园迅邤?，線性代數和概率論看一遍，這里推薦李航的統計學習方法?！　?/p>

　　圖像處理：如果是做圖像方面的小伙伴，那么需要把岡薩雷斯的圖像處理那本巨作看一遍，需要懂基本的圖像概念和基本方法?！　?/p>

　　還有機器學習深度學習經典書、如果能把這幾本書完全吃透那也很厲害了，當然學習知識點的途徑還有很多。

　　學習社區

　　Google

　　TinyMind　　

1024你懂的国产日韩欧美_亚洲欧美色一区二区三区_久久五月丁香合缴情网_99爱之精品网站

<listing id="lnlbz"></listing>

<address id="lnlbz"></address>

<form id="lnlbz"><th id="lnlbz"><listing id="lnlbz"></listing></th></form>

<form id="lnlbz"></form>

<progress id="lnlbz"><nobr id="lnlbz"></nobr></progress>

<address id="lnlbz"><sub id="lnlbz"><menuitem id="lnlbz"></menuitem></sub></address>

<listing id="lnlbz"><font id="lnlbz"><cite id="lnlbz"></cite></font></listing><thead id="lnlbz"></thead><rp id="lnlbz"></rp>

責任編輯：韓希宇

免責聲明：

中國電子銀行網發布的專欄、投稿以及征文相關文章，其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方；如涉及未經許可使用作品的問題，請您優先聯系我們（聯系郵箱：cebnet@cfca.com.cn，電話：400-880-9888），我們會第一時間核實，謝謝配合。

快訊

NEWS FLASH 更多

金融監管總局副局長付萬軍：正研究制定金融消保領域框架性文件

10:20

5月15日，金融監管總局副局長付萬軍在2025年“5·15全國投資者保護宣傳日”活動上表示，金融監管總局正在研究制定金融消保領域的框架性文件，加快修訂投訴處理管理辦法。同時，不斷完善金融消費者權益保護監管評價機制，引導機構充分認識消費者保護與自身經營發展的共生邏輯，將消保理念有機嵌入產品研發、業務流程、營銷宣傳、內部考核等環節。
樂山市商業銀行行長李映軍任職資格獲批

10:02

13日，四川金融監管局披露批復顯示，四川金融監管局核準李映軍樂山市商業銀行行長的任職資格。
重慶發文推動銀行與有關機構合作提供跨境人民幣收付服務

16:03

近日，重慶市印發《重慶市加快培育從訂購到交貨的國際物流全鏈條服務體系實施方案（2025—2029年）》。

中國與東盟推動跨境支付互聯互通

15:58

目前，人民幣跨境支付與清算網絡正在持續完善。東盟地區約有100家銀行已直接或間接接入人民幣跨境支付系統（CIPS），通過該系統使用人民幣進行結算，有效促進人民幣在東盟的使用。近期，銀聯國際與越南國家支付股份公司（NAPAS）簽署了關于推進中越之間二維碼跨境支付服務的合作備忘錄。
廣發銀行發布關于選舉董事長的公告。

11:12

4月29日，廣發銀行發布關于選舉董事長的公告。廣發銀行第十屆董事會第十六次會議選舉蔡希良為董事長。蔡希良現任中國人壽集團黨委書記、董事長。這延續了近年中國人壽集團董事長兼任該行董事長的一貫安排，顯示中國人壽集團對廣發銀行的重視與支持。
螞蟻消金2024年資產總額超3100億，持續穩健發展

09:14

4月21日，重慶螞蟻消費金融有限公司2024年經營數據被披露。數據顯示，2024年螞蟻消金資產總額3137.51億元，營業收入152.13億元，全年公司實現凈利潤30.51億元。

金視點

Peak Point 更多

央行科技司司長李偉：中小銀行要堅定數字化轉型，穩妥推進人工智能應用

11:32

對于人工智能大模型在金融領域的應用，中國人民銀行科技司司長李偉指出，要鼓勵創新和規范發展并舉，依托科學合理的治理機制設計，讓大模型金融應用走得動、走得通、走得正，讓監管看得到、認得清、穿得透，讓風險防得住、防得準、管得住、解得了。
交通銀行錢斌：以人為本智能向善描繪數字金融新圖景

10:33

在 2024世界人工智能大會上，交通銀行副行長、首席信息官錢斌出席并作主旨演講，他表示當前，AI技術正成為推動世界之變、時代之變的重要驅動力。從金融實踐來看，AI已經在金融數字化轉型過程中培育形成新質生產力，塑造出數字金融新生態。但與此同時，AI進一步發展也面臨許多問題挑戰，包括價值對齊、科技倫理、數據保護等等。
交通銀行任德奇：有效提升普惠金融的覆蓋率和質量，關鍵是用好數字化技術

10:30

陸家嘴論壇上，交通銀行董事長任德奇表示，扎實做好普惠金融大文章，是金融機構貫徹落實黨中央決策部署的一項重大工作任務，需要久久為功，持續加力。未來有效提升普惠金融的覆蓋率和質量，關鍵是用好數字化技術，交通銀行重點通過四個“加強”持續發力，一是通過加強數據賦能和提高融資可得性；二是通過加強線上與線下的融合，即“雙線融合”，提高融資便捷性；三是加強產品供給，提高居民收入，滿足人民群眾多樣化金融需求；四是加強重點領域小微企業服務。

今日排行

RANKING TODAY

“穩定幣”首個IPO ——Circle上市，監管合規與創新發展成必然趨勢

熱詞理財支付銀聯白皮書中國銀行征信 CFCA 網上銀行投顧區塊鏈手機銀行 5G消息理財子公司綠色金融廣發銀行上市銀行農商行隱私計算數字人民幣

研究

RESEARCH

合集｜中國數字金融調查報告(2017-2024)

重點關注電子銀行、金融科技領域，通過企業拜訪、資深從業者訪談，電話調查等專業手段獲取前沿信息，力求出品最具前瞻性和參考價值的內容。因為專業，所以領先！[詳細]

會議

MEETING

招聘

RECRUIT

收藏成功

確定