期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘 要: 針對P2P網絡信貸平臺信用風險特點,以借款人違約情況為被解釋變量,運用Logistic回歸方法建立借款人信用違約風險評估模型。原始數據從人人貸網站抓取獲得,選取的原始評估變量有24個,通過信息增益進行指標降維,得到19個解釋變量,并以此建立了Logistic回歸模型。通過五步逐次回歸得出,性別、逾期次數、逾期金額、身份認證和學歷認證等5個因素作為評價個人信用風險的主要依據,并建立了Logistic回歸模型。回歸模型的判別準確率表明所構建的借款人信用風險評估模型預測效果較好。
關鍵詞: P2P網絡借貸;信用違約風險; Logistic回歸模型;信息增益
P2P網絡借貸全稱是“Online Peer to Peer Lending”,指的是個體與個體之間通過網絡實現的直接借貸。出借方和借款方既可以是自然人,也可以是企業。2005年,世界上第一家網絡貸款平臺Zopa在英國成立,次年網絡貸款平臺Prosper在美國成立,隨后,日本、西班牙、韓國等國家也紛紛成立了自己的網絡貸款平臺。2007年,中國最早的網絡貸款平臺——拍拍貸成立,此后,其他網絡借款平臺陸續出現。2010—2012年,我國的P2P網絡借貸平臺由10家增長到200家,網絡借貸成交額由15億元增至212億元。隨著社會經濟的不斷發展以及大眾融資需求的增加,2012年后我國P2P網絡借貸得到快速發展。2013年,我國網貸平臺數達到800家,成交額達到1058億元;2015年,網貸平臺數達到2595家,成交額達到9823億元。 2017年,我國網貸平臺數量達到了6363家,全年網貸行業成交量達到了28048.49億元,相比2016年全年網貸成交量(20638.72億元)增長了35.9%;預計2018年上半年網貸行業成交規模將趨于穩定,下半年或迎來成交量新高,全年P2P網貸成交量大概率突破3萬億元。
2018年上半年P2P行業成交額小幅下降,這一現狀暴露了P2P網貸行業目前存在的各種問題。平臺層面,包括平臺跑路、平臺關閉等;借款人層面以借款人的信用違約行為最為突出,信用違約不僅會給網貸平臺造成運營風險,而且也會對整個網貸行業造成不良影響。目前,借款人違約行為頻發的原因在于網絡借貸信息的不對稱和道德風險引發的借款人騙款行為。解決P2P網貸中借款人的違約風險問題、加強平臺對借款人的風險評估對P2P行業健康穩定、可持續發展十分重要。因此,本文將實證分析借款人的信用違約行為,研究造成借款人信用違約的影響因素,為投資人、政府監管部門、網貸平臺提供參考。
本文將選用Logistic回歸模型,定量研究P2P借款人信用違約風險的影響因素。
1 數據預處理與備選指標選取
1.1 數據來源
本文通過八爪魚軟件從人人貸網站上抓取2017年3月至2017年7月的1189條“散標投資”及“債權轉讓”中真實借款標作為源數據。源數據包括876條正常數據和313條違約數據,相關研究經驗表明,正常客戶是違約客戶的3~5倍時,評估模型更加有效。因此,按照通行的建立個人信用評估模型時的取樣比例,再從876個正常數據中抽取履約客戶414個、違約客戶115個構成建模樣本。初步收集到的客戶信息有用戶名、年齡、性別、受教育程度、婚姻狀況、工作城市、公司行業、工作時間、崗位職位、平均月收入、房產、房貸、車產、車貸、借款用途、借款年利率、借款金額、還款期限、逾期次數、逾期金額、身份認證、學歷認證、信用認證、收入認證和工作認證。
1.2 數據預處理
數據預處理包括數據清理和數據轉換兩個步驟。數據清理處理數據的不一致、不完整,刪除對信用風險評估無意義的變量,提高運算效率。文中選取的“人人貸”散標投資數據對借款人信息審核比較嚴格,數據完整性較好,因此不需要填補某些空白值,只需刪除用戶名、注冊時間等無關變量。
數據轉換是對于干凈數據進行增強處理的過程,這種增強過程主要是對樣本數據中的變量類型進行數據規范化、數據離散化、數據規約,以及創建新變量處理。
1.3 解釋變量分組
經過數據清洗和數據轉換,得到相對干凈的建模樣本,然后對年齡、性別等解釋變量進行分組。分組時應在考慮經濟含義的基礎上,將定性指標定量化,便于后續的數據分析。具體指標分組見表1。
分類表給出的是回歸模型對履約(Y=0)和違約(Y=1)兩類借款人的分類準確率,可以看出,回歸方程對414個觀測值為0(好客戶)的正確預測407個,失敗7個,預測準確率為98.3%;回歸方程對115個觀測值為1(好客戶)的正確預測109個,失敗6個,預測準確率為94.8%。綜合以上分析,回歸模型對建模數據的總回歸判別準確率為97.5%。根據樣本回歸判別準確率,可以認為,所構建的借款人信用風險評估模型預測效果較好。
3 結論與展望
本文選取人人貸平臺借款人信用風險相關信息為指標,利用Logistic回歸模型,得到預測效果較好的信用風險評估模型,最后得到的回歸模型中僅保留了性別、逾期次數、逾期金額、身份認證和學歷認證5個指標。
本文的研究結論具有較強的現實意義。在P2P網貸平臺層面,必須健全借款人和投資人身份認證和信息審核機制;個人層面,在日常借貸行為中,一定要重視個人誠信和信譽,遵守網貸平臺規范,在網貸平臺中填寫真實、有效的個人信息;政府層面,亟須建立健全個人征信系統和P2P網貸平臺監管的法律法規,創造優良的投融資環境。
本文還存在一定的不足。本文中樣本數據僅局限于人人貸平臺,未來可以選用拍拍貸等多個平臺數據進一步研究算法的通用性。
參考文獻:
[1] 網貸之家.2017P2P行業年報簡報:問題平臺持續降低[R].2018.
[2] 陳霄,丁曉裕,王貝芬.民間借貸逾期行為研究——基于P2P網絡借貸的實證分析[J].金融論壇,2013,18(11):65-72.
[3] DINH T H T, KLEIMEIER S. A credit scoring model for Vietnam′s retail banking market[J]. International Review of Financial Analysis, 2007, 16(5):471-495.
[4] BARASINSKA N. Does gender affect investors′ appetite for risk? Evidence from peer-to-peer lending[J]. Social Science Electronic Publishing, 2011:112-119.
[5] WANG H, GREINER M, ARONSON J E. People-to-people lending: The emerging e-commerce transformation of a financial market[M]. Berlin: Springer, 2009:182-195.
[6] BAKLOUTI S. Judging borrowers by the company they keep: Friendship networks and information asymmetry in online peer-to-peer lending[J]. Social Science Electronic Publishing, 2013, 59(1):17-35.
[7] 李廣明,諸唯君,周歡.P2P網絡融資中貸款者欠款特征提取實證研究[J].商業時代,2011(1):41-42,58.
[8] KUMAR S. Bank of One: Empirical Analysis of Peer-to-Peer Financial Marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Amcis 2007, Keystone, Colorado, Usa, August. DBLP, 2007:305.
推薦閱讀:管理學家期刊評什么級別職稱