克萊姆法則金融方面的運用?9月22日,2016中國消費金融高峰論壇在北京富力萬麗酒店正式開幕本次論壇以消費金融的發展、創新合作為主題,聚集消費金融業内大咖在22、23日兩天内展開讨論和研究信而富首席戰略官王峻發表演講 ,我來為大家講解一下關于克萊姆法則金融方面的運用?跟着小編一起來看一看吧!
克萊姆法則金融方面的運用
9月22日,2016中國消費金融高峰論壇在北京富力萬麗酒店正式開幕。本次論壇以消費金融的發展、創新合作為主題,聚集消費金融業内大咖在22、23日兩天内展開讨論和研究。信而富首席戰略官王峻發表演講。
對于目前征信的現狀,王峻分享了兩個問題:首先是傳統征信數據覆蓋率不足,其次網絡客戶申請中還存在着大量的欺詐。王峻表示,對于消費金融而言,不僅可以采用實時管理性審批額方式,也可以采用預先篩選機制進行篩選。
王峻認為,在進行消費信貸的過程中,一定要确認客戶的還款能力、還款意願和穩定性,把弱相關的變量綜合考慮就會告訴我們很多東西。
以下為發言原文:
王峻:非常容幸到這個論壇分享信而富公司對科技的應用,前面兩位嘉賓都談到中國的現狀傳統的征信體系覆蓋不足,今天我和大家談一下我們學習到的東西。今天分享兩個問題:一個是傳統的征信數據覆蓋率非常低,第二就是網絡客戶申請中存在的大量欺詐。這個數據是基于央行征信局2015年10月的報告,中國14億人口中有征信記錄的人是3億,真正有征信數據的有2.7-2.8億人,下面這個客群差不多有5億左右,因為有社保基金有識别信息,如果調征信報告會調出來一張白單因為沒有傳統的信貸信息。更多的人群不在體系範圍内,包括了未成年人和老年人,有很多在工作年齡的人在最後的5.3億裡面。這是中國的傳統征信體系的現狀。我對美國的市場比較了解,它的征信覆蓋非常的完善,是基于Fico評分的系統,在有收入年齡的人群裡面覆蓋率非常高,在Fico裡面它是非常完善的金字塔。在這樣一個金字塔下第一個跟中國相比有比較全的征信的覆蓋,還有很重要的數據就是美國監管給金融機構定價權,它基于風險偏好進行定價,隻要不突破峰頂可以自由定價。在美國運通卡隻做最好的人群,它的信用卡利率非常低的,很不好的人也不是沒有金融機構覆蓋,但是覆蓋你的話受的費率可能會高,給你的信用卡每年要收幾百美金的年費。這是中美很大的區别!
還有一個區别就是欺詐的問題,傳統的信用金融機構的理解,你的壞賬主要來源是指逾期和壞賬,在美國它跟失業率和經濟周期非常相關,經濟下行失業率上升那麼壞賬率會上升。中國壞賬很大一塊來自于欺詐,在申請過程中有着身份欺詐銀行流水作假等等,有的平台自己報道欺詐占壞賬60%以上,我們必須考慮如何應對欺詐的風險。簡單介紹一下信而富公司,我們的創始人王征宇博士01年回國,當時中國沒有信用卡業務,從10年開始中國轉型進入P2P業務,我們通過手機端小額短期,我們的客群比較年輕,我們平台撮合貸款超過800萬。KYC我們對目标客群有一個清晰定位叫“愛碼族”就是一個成長中新興一族手機控,一直用手機上網社交消費等等,他們會留下大量的足迹可供我們分析,職業教育程度是職校大專本科數量不是很龐大,他們一般不會再央行系統裡面有他們的征信報告,一般來說沒有房和車,去小貸公司不會拿到貸款,這是我們的目标客群。
這個客群有穩定的收入,在央行裡面有穩定身份信息的記載,但是他們有很高的消費需求,跟父母年代不同,他們的消費習慣接受是先消費後還款。怎麼樣在傳統征信信息缺失的情況下對他們的信用進行判斷,我們在移動互聯網的環境下留下的諸多足迹進行分析。信而富跟大的互聯網平台包括社交電商包括搜索進行合作,采集愛碼族留下的數碼足迹,在虛拟空間留下的足迹做的搜索社交群裡面的人一度二度關系,如果知道手機通訊錄或者QQ群裡面有很多人是老賴那麼他是老賴的幾率就會高很多。“一個人手機号碼十年不變”證明這個人信用良好,同樣這個對移動互聯網信用分析也很好用。手機端你要填很多的信息,但是有足夠樣本量的時候就可以分析填寫的速度有多快,選擇貸款額度從一千到一萬你這個手指滑動速度有多快多慢,這些都跟分析你最終是否是壞賬相關。這些細微東西每一個不足以強到回答我們在信貸中必須回答的三個問題:還款能力、還款意願和穩定性,我們把弱相關的變量綜合考慮就會告訴我們很多東西。如果能調到一個人有多少張信用卡,它的還款曆史,它的房貸車貸,那麼這些都是非常強相關的信息,所有的這些途徑互聯網的數碼足迹提供的弱相關的數據,它會給你一個方向。我們用到這麼多東西說白了是逼出來的,因為中國的征信系統覆蓋率非常低,但是通過這樣的東西,國内先進的機構分析處理這樣數據的能力比美國機構要強,因為美國被Fico系統寵壞了。
我們有了大量的互聯網數據之後,那麼是否數據越多越好?傳統的統計學分析是用邏輯回歸模型,它把幾個變量進去預測一個Y的變量,但是這個模型有一個局限放進去的變量不能太多,一般10個以下,10-20之間就是它的局限,20以上這個模型就無法用了。但是在互聯網情景下變量是成百上千,再把衍生變量算進去這個變量無限大,你無法用傳統的模型進行分析,這時候大家就會聽到機器學習。機器學習是在海量數據上形成它的邏輯和判斷,它裡面有很多具體的技術。
我講一個經典的用技術學習機器學習來進行判斷和傳統的Fico評分系統進行的比較,這是麻省理工學院做的經典研究。上面這圖是用傳統的Fico評分進行分析,綠色的就是帳期正常,Fico評分高780-800分都是綠色的,下面是用機器學習對更大數據量進行分析,大家看到也不錯,高的這邊也是綠色,低的這邊是紅色。但是如果你把兩種評估方式進行對比,尤其采用二維空間對比的辦法就會發現有一定的區别。這個圖我講解一下:它的橫軸是傳統的Fico信用評分,綠色比較多,左邊是低的,證明它是傳統評分信用比較差,豎軸是機器學習,零是最高點,機器學習100是差的,右下角Fico評分和機器學習都認為這個人很好基本上都是綠色的,左上角兩者都認為這個人是壞的,都是紅色沒有問題,但是比較有趣的是左下角傳統Fico評分體系下被認為是壞的,通過機器學習發現這些人其實是好的,用逾期率證明它表現非常好。傳統的Fico評分有一些局限,在美國有一些西班牙人在銀行不太有借款,但是這個人的還款意願還款能力甚至收入都很好。意思說就是機器學習不是替代了Fico,但是如果兩種綜合一起進行評估模型預測的精準度增加很多。
下面講一下欺詐,剛才姚明總講了一下消費場景下實時申請看關聯性等等進行審批。我講另外一種模式,我們公司采用了一種預先篩選機制,實時申請就意味着你要申請人提供信息和材料,他知道他要準備什麼,他知道什麼材料要作假,預先篩選因為我要篩選的變量跟邏輯模型是我自己知道的,在篩選人不知道的情況下我進行分析,在某一個平台上對于互聯網平台上的用戶帳齡,活躍度關聯人的關系,我進行分析之後5000人的平台有2000萬進行放貸,這2000人是我預篩選它就不存在作假的機會,它可以很大程度降低欺詐風險,這樣模式未必适用于所有的消費金融場景。我們去年做了比較大規模的測試,開放申請和預先篩選模式的表現的差異。兩者差别非常大,逾期率有20%的差别,我們作為一種可能的模式也向大家推薦,是否在時時申請開放申請的情況下也進行預先篩選,進行有效風控。時間有限就講這些,謝謝!
(财編:admin)
,