打假:不是所有的網貸技術都叫AI

打假:不是所有的網貸技術都叫AI

十年前,你要貸個款,沒個十天半個月,沒點拿得出手歐的抵押物,基本甭想。近些年,大數據和AI技術風起雲湧,聲稱掌握了核心科技的網貸業務也如火如荼。

度娘上一搜,各種寶,P2P,紛紛打著AI、大數據風控、智能搜索引擎的旗號,不AI不放貸。

比如,這篇文章是這麼說的“隨著大數據、人工智能等技術的發展,金融智能化趨勢愈加明顯。眾多網貸機構也早已試水基於人工智能的各項金融業務創新,包括智能風險防控、智能投顧等。在傳統的徵信數據外,社交、電商等數據也開始被廣泛應用於風險防控。這為機器學習、人工智能體系的訓練和優化提供了充足的原材料。”

真是不AI不網貸。

但是!其中也不乏一些平臺打著AI的幌子,乾的確是不那麼AI的活兒。筆者所知的一個大型機構的智能審貸業務是這麼玩的。

第一步,反欺詐。你是否是你?先是活體檢驗,讓你拍照眨眼,人臉識別確認你是否是活的,和身份證上照片是否一致。你是否提供虛假信息?地址信息校驗、郵箱信息校驗等。你是否已經是壞人?黑名單和多頭信息查詢。反欺詐的手段和方法比較豐富,根據業務經驗會有很多反欺詐的規則,也會有一些圖算法模型輔助識別欺詐人群和黑中介。

這些算法中充其量能算AI的也就只有人臉識別,可惜人臉識別已經是業內比較成熟的技術模塊了,隨處可買,人臉識別也並不能成為這家機構的核心技術。

第二步,信用評分。此處用到的確是最為原始的評分卡技術,比如說A(Application)卡,也就是利用客戶的申請信息預測客戶未來一段時間違約的概率。對於分數高的客戶准予通過,並根據推斷的收入信息,給客戶核定授信額度。這個A卡用到的數據一般就是經過校驗後的客戶基本信息、設備信息、客戶授權後臺查詢到的徵信數據、公積金數據、社保數據等。由於信用評分模型解決的是二分類問題,因而傳統採用的是邏輯迴歸算法。邏輯迴歸算法,簡單點講就是對於不同關鍵變量的不同取值分段,給出一個分數估計,這樣客戶成為壞客戶的概率便轉化為各個不同打分變量分數加總的形式。下面就是一個評分卡的示例。

打假:不是所有的網貸技術都叫AI

這裡的評分卡技術就是最傳統的邏輯判斷,什麼大數據訓練、客戶畫像這些技術是基本用不著的。這一步是中國傳統信用卡用了好幾十年的老技術了,可謂一點也不AI。

一言以蔽之,這樣的方法充其量算是自動審批,離智能審批還差了十萬八千里。加上了個人臉識別,也只能算是半吊子AI,穿著人臉識別馬甲的假AI。

打假:不是所有的網貸技術都叫AI

二、讓人exciting的AI智能審批。

真正的AI智能審批應該長什麼樣呢?

作為一個AI專業畢業的本魚來說,沒有模型,就別談什麼AI。簡單來說,一個真正的AI智能審批系統至少要具備以下四個點。一是海量的數據。二是多維的特徵。三是訓練模型。四是自動分類結果。除此以外的玩意兒都不能叫AI。

三、讀進軍AI大數據的同學們的一點建議。

首先,算法學習。主流的機器學習的主流算法你得懂吧。找本書好好看看,周志華的《機器學習》你值得擁有, Goodfellow的《Deep learning》也可以好好看看。

其次,編程技巧。目前常用的大數據分析軟件有有SAS、R、Python,Python的應用前景會更廣一些,更為先進的AI算法有很多開源庫需要知道。另外對於數據庫軟件也要有一定了解,目前大數據用到的比較多的是hadoop、spark,因而相應的數據查詢和處理語句也要掌握。

再次,業務積累。對於數據的理解很重要,重要特徵的提取會很大程度提升模型的區分度。例如做小微貸款,對於稅務數據的理解以及結算流水數據的理解便於衍生有效特徵,用於模型開發。

相關推薦

推薦中...