目前,我國金融科技專業人才存在缺口或供需不匹配問題。在作為新一代人工智能技術的大模型領域,專業人才短缺問題或更為明顯。畢竟,隨著大模型的應用不斷深化,各家銀行越來越關注大模型技術人員,對于相關人才的“渴望”較為強烈。
據《銀行科技研究社》了解,目前有多家銀行正招聘大模型相關技術人才。此次以工商銀行、招商銀行為例,看看兩者近期需要怎樣的大模型技術人才。
工行軟開招聘大模型方向的數據工程專家、算法專家
工商銀行軟件開發中心上海研發部、杭州研發部均開啟了長達一年的大模型相關崗位招聘,報名開始時間為2024年3月1日,截止時間為2025年2月28日。其中,大模型方向的數據工程專家工作涉及數據處理、數據正確性判斷、數據分析、數據標注、prompt調優等方面;大模型方向的算法專家工作則涉及算法研究、技術跟進、大模型應用和落地等方面。
上海研發部招聘大模型方向的數據工程專家,職責包括:負責大模型數據任務構建,能夠負責有效的高質量數據生產、整理和清洗工作;能參與到大模型訓練數據的構建,對數據正確性提供判斷,對模型生成內容正確性提供判斷,對模型進行內容改進策略建議;對大模型應用案例和數據進行分析,歸納關鍵性和普遍性問題,提高內容優質率;推動大模型應用方向數據標注工作,指導標注人員完成數據的高質量構建,保證按目標及質量要求完成結果產出;對大模型的prompt撰寫有了解,并且能夠根據應用場景,進行prompt調優,驅動模型達到最優效果。
該崗位的其中一項任職要求為,有NLP自然語言處理經驗者優先;對大模型數據要求、大模型訓練過程了解。
上海研發部還招聘大模型方向的算法專家,職責包括:深入研究大型模型領域知識,跟進最新技術進展,對大模型研發、算法有深入研究;能夠規劃和突破基于海量數據的語言理解和生成大型模型、跨模態理解和生成大型模型等關鍵技術方向;語言理解和生成大型模型學習、跨模態理解和生成大型模型學習、跨任務統一學習、高效的大型模型架構等;以行業領先為目標,研發和建設理解表示、語義生成大型模型技術,并推動大型模型技術在業務端的產業應用落地和發揮業務價值,提供系統解決方案,打造可規模復制的產品能力。
該崗位對于大模型技術掌握的要求更高,任職條件包括:具備NLP/CV、大規模預訓練模型、大規模語言模型、跨模態理解和生成學習等領域的相關工作和項目落地經驗,有扎實的研究積累;熟練掌握深度學習框架,如TensorFlow、PyTorch等,熟悉分布式計算、GPU加速和高性能計算等技術,能夠優化大型數據集;具備豐富的深度學習算法調優經驗和大型模型訓練工程經驗者優先考慮;擁有優秀的大型模型研究能力,能夠在高質量期刊和會議上發表論文,有開源項目的經驗者優先考慮等。
杭州研發部則招聘大模型方向的算法工程師,具體為大模型算法崗、前沿LLM算法崗,職責包括:負責算法工作,探索前沿大語言模型在工商銀行業務和未來應用場景的落地和應用;負責開發面向分行的智能幫助系統,與產品和運營團隊密切合作,理解用戶意圖,利用先進的大模型技術以對話方式設計并落地解決方案;結合前沿大語言模型,對用戶行為進行總結、理解、畫像等探索,為精準營銷提供決策依據。
招行招聘智能科學研發崗多個細分方向的大模型技術人才
招商銀行總行信息技術部也在招聘大模型技術人才,截止時間為2024年10月31日。這些崗位均屬于智能科學研發崗,但是分為不同的方向,包括基礎大模型、大模型應用、智能體應用、多模態應用等。崗位任職要求中,除了限制碩士研究生及以上學歷和相關專業背景外,還有專業上更細化的要求。
其一是智能科學研發崗-基礎大模型研發方向,職責包括:深入理解自然語言處理領域和大模型預訓練技術,研究并掌握最新的預訓練技術;負責預訓練模型、訓練方案設計與實現,和AGI技術方向規劃與關鍵技術突破;針對應用場景構造高質量數據、清洗數據,完成NLP算法的建設與持續優化。
專業要求為:扎實的機器學習、深度學習、NLP算法基礎,熟悉強化學習、文本生成搜索策略等;熟練掌握C++和python語言,具備較強的代碼工程能力,至少熟練掌握tensorflow、pytorch中一個深度學習框架,熟悉常見的機器學習和深度學習算法,能快速復現前沿算法;有Megatron/Deepspeed等多機多卡訓練框架經驗優先,有量化/蒸餾等推理優化經驗優先;具備大規模預訓練模型理論基礎和豐富的實踐經驗等。
其二是智能科學研發崗-大模型應用研發方向,職責包括:負責大模型應用成果轉化,基于最新的大語言模型、多模態等技術方法,實現金融領域下游任務場景(chatbot、風控、輔助文案等)的落地應用;負責金融領域大模型微調與提示詞工程;跟蹤并分析業內最新研究成果和技術動態,持續優化和改進現有模型和技術方案。
專業要求為:扎實的機器學習、深度學習、NLP算法基礎,熟悉強化學習、文本生成搜索策略等;熟練掌握C++和python語言,具有大模型以及langchain應用領域研發經驗;熟悉LORA、QLORA等大模型微調技術,大模型Prompt工程等。
其三是智能科學研發崗-智能體應用研發方向,職責包括:熟悉大模型底層機制,能夠獨立完成某個領域智能體從0到1的效果優化;熟悉prompt工程,擅長通過prompt完成流程化問題解決;擅長工具/數據的大模型調用能力調優,并具備相關能力的落地經驗;長期監測和評估智能體本身的效果,并定期完成競品的洞察和對標;持續跟進智能體技術發展趨勢,提出新的分發策略和優化建議。
專業要求為:熟悉及掌握Transformer時代的NLP各方向技術,并有對LLMs在各場景上應用的知識儲備;具備豐富的實踐經歷,熟悉圖文領域智能體現有方法論,有智能體實踐案例;具備產品化思維,理解模型能力邊界、優化方向,以及清晰拆解客戶需求并定義問題,完成業務至技術的語言轉換等。
其四是智能科學研發崗-多模態應用研發方向,職責包括:負責多模態大模型研究;基于多模態大模型的預訓練/SFT模型的訓練、評測、部署;基于多模態大模型在金融業務場景上的應用,包括并不限于多模態分類、標簽、caption等文本生成等;跟蹤、探索多模態預訓練前沿技術,并適時進行技術分享、專利申請和頂刊論文發表。
寫在最后
當然,關注和需要大模型技術人才的銀行,遠不止工行和招行。據《銀行科技研究社》了解,多家國有銀行、股份制銀行、城商行、民營銀行、農商行在招聘或曾招聘大模型技術人才,可以看到,大模型方向的金融科技人才正備受青睞。
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。