重磅!頂級國際期刊收錄360數科首創的GBST算法觀點

長期以來,如何以最優策略與手段化解信用風險是金融行業每家機構持續鉆研的課題。
長期以來,如何以最優策略與手段化解信用風險是金融行業每家機構持續鉆研的課題。就在近日,360數科白苗君、鄭彥、沈赟研究發表的論文Gradient boosting survival tree with applications in credit scoring(GBST算法在信用風險領域的應用),一舉被關注各個領域中技術方法應用的運籌學雜志——英國老牌頂級運籌學期刊Journal of the Operational Research Society收錄。360數科風控研究團隊以目前國際上信用風險分析領域最熱門的前沿模型“生存分析模型”為切入點,結合集成樹模型,更加精確地刻畫風險隨著時間的變化趨勢,從而做出更加精準的風險決策。
隨著互聯網金融和電子商務的快速發展,中國消費金融市場近年來進入了市場爆發期。盡管信貸需求大量井噴,但是央行征信報告的覆蓋率卻不高,很多信貸機構不得不使用大量稀疏異構的數據來進行信用評估。因此,信用基礎設施的缺乏讓中國的信貸機構面臨嚴峻挑戰,更先進的信用評估技術呼之欲出。
360數科在信用風險評估層面應用的生存分析模型最初源于處理死亡數據,是保險精算、生物醫學領域廣泛應用的熱點模型。生存分析作為一種傳統的統計方法,用于處理生命周期數據,探索生存時間的分布情況。360數科研究團隊意識到,生存分析考慮了時間維度的概率預測問題,如果應用在信用風險領域,能夠相比傳統的信用評估等模型在預測違約的可能性之外,進一步預測用戶何時違約。除此之外,模型還能夠刻畫用戶由于非違約事件而發生的借款中止行為,如提前還款、轉向其他貸款公司等情況。
中國消費金融市場研究報告表明,金融業務不斷下沉到更加廣泛的人群,而這部分人群征信數據的大量缺失導致需要其他多元化的數據來彌補,由此產生了大量的三方資信、行為的數據。而這些數據的高維稀疏異構的特點對傳統的信用模型來說帶來了極大的挑戰,而集成學習模型的框架卻可以很好地解決這一問題,其通過多個學習器的組合,對不同特性的數據進行處理建模,泛化能力明顯優于傳統的單一學習器。結合生存分析可以處理時間維度問題這一優勢,360數科提出以生存分析模型為基礎,結合boosting的集成學習算法框架的梯度提升生存樹(GBST)算法,以預測用戶在不同時間段的風險概率分布,通過優化總體損失,大大減少每個時間段預測概率的誤差,以達到降低風險的目的。
在風控場景中,該算法可以更精準地預測客戶發生分期借款后每期的違約概率,用最小的時間成本進行未來更長期的風險決策,如貸前風險準入、貸中優質客群撈回等。除此之外,該模型可以幫助風控策略制定更加合理的額度、定價及期數策略,實現個性化產品定制。
在營銷場景中,通過GBST算法對存量客戶在時間維度上進行動態借貸意愿預測,輔助營銷部門進行用戶營銷,助力于實現多樣化、多客群、多狀態的線上營銷策略,在節約營銷成本的同時提升成功率及用戶轉化率。
一直以來,360數科領先的風控成績深受全行業的認可。目前,360數科申請的GBST專利已獲得國家知識產權局授權。在公司申請的804項發明專利中,涉及大數據風控全流程管理的核心技術比例超50%。可以說,風控算法與策略的前沿探索是其保持先進性的獨特秘訣。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。