原工行董事長姜建清曾說:未來的好銀行一定是數據銀行。數據銀行的兩大核心能力就是數據採集和數據分析。近來,有不少銀行在數據分析方面有所行動,有的是成立“統計信息部、數據分析部”,有的是將數據分析能力重新明確到信息中心等。
按百度百科的定義:數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。
這個定義比較精確,包含了幾個要點:
統計分析方法:數據分析肯定需要分析方法及工具;
大量數據:分析的原材料;
形成結論:分析的結果;
決策並採取適當行動:數據分析最終實現價值。
質量管理體系:避免數據汙染及模型誤差。
數據分析的定義和工作流程都很清晰,同時,如何快速啟動數據分析工作並儘快體現數據分析的作用,是很多數據分析類部門當前關注的重點。
數據分析的建設之路,可以從下面幾個方面統籌考慮:
業務應用方向
銀行的業務應用經過多年發展,已經有成熟的應用框架:客戶管理、風險管理、財務管理、運營管理、及監管報送及信息披露。
數據分析部門應結合業務發展及規劃,綜合相關IT系統建設情況,選擇數據分析的業務領域。
數據分析方法
在統計學中,統計分析方法可以簡單劃分為:描述性統計分析、探索性數據分析以及驗證性數據分析。
在數據分析初期,分析部門更應該放在描述性及探索性方法上。在此過程中與科技、業務部門多交流溝通,以達到熟悉業務、瞭解數據的目的。
數據分析體系
數據分析體系包括數據分析平臺的建設,分析平臺包括三大模塊:
數據脫敏採集平臺:根據分析需要,從銀行數據平臺中脫敏、抽樣相關數據;
數據建模平臺:也可稱為模型數據沙箱,用來進行數據分析;
數據服務平臺:為業務應用提供數據分析結果服務。
以下就舉例東北證券的數據平臺建設經驗。