信用評分管理模式_第1頁
信用評分管理模式_第2頁
信用評分管理模式_第3頁
信用評分管理模式_第4頁
信用評分管理模式_第5頁
已閱讀5頁,還剩19頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、信用評分 信用評分通常正式的定義為一種統計或定量方法,用于預測貸款申請者或現存借款人將發生違約或拖欠的概率(Mester,1997)。信用評分的目的是關心信用提供者量化和治理包含在提供信用中的金融風險,以便于他們能夠更好的而且更為客觀的作出借貸決策。關于信用評分的進展能夠總結如下。在1936年,Fisher引入了在一個總體中的不同群體中進行區不的思想(例如通過使用物種的軀體大小來區分鳶尾的兩個種類)。在1941年,Durand(他在美國國民經濟研究局工作)意識到Fisher 的判不分析能用來區分好的或者壞的貸款。 許多年來,關于提供貸款的決策差不多上由信用分析師來判定的。在第二次世界大戰期間由

2、于缺乏信用分析師,許多機構要求分析師們寫下他們用于評價申請貸款者的信用狀況的評判規則(Johnson,1992)。 然后利用這些規則來關心進行信用決策。世界大戰之后,人們把這兩項事件結合在一起同時開始考慮在決定貸款申請者的過程中使用統計學生成模型的優勢。在二十世紀六十年代,伴隨著信用卡的誕生,銀行與其他信用卡發行組織意識到了信用評分的優勢。當人們開始應用信用卡的數量逐漸增長的時候,能夠自動化信用準許過程的問題就變得特不急迫。使用信用評分的企業也意識到了這些預測違約的評分比起任何決策方法都要來的好(Myers,1963)。 這些評分同樣關心企業組織減少拖欠費率。1975年在美國通過了同等信用機會

3、法案(The Equal Credit Opportunity Acts), 這在1976年被標記為重要事件:法案意味著同意對信用評分來便利于借貸決策,同時愛護消費者的利息收入以防止不公平的發生率。在二十世紀八十年代,對信用卡的信用評分的成功促使銀行開始使用信用評分用于其它的目的(比如個人貸款申請)。在二十世紀直接營銷的進展同樣也導致了信用評分方法的使用來增加廣告戰略的回應率。在最近這些年里,信用評分差不多開始用于家庭貸款、小型商業貸款、保險申請和續訂。同時關于這方面的關注也開始從減少貸款應用的拖欠轉向了從客戶獲利方面的增長(Thomas,2000)。信用評分的好處信用評分具有專門多好處,不僅

4、僅對借款者如此,對貸款者同樣如此。舉例講明之,由于信用評分模型提供了關于用戶信用價值的客觀分析從而能夠關心簡化判不。這但是使得信用提供者僅僅關注于與信用風險相關的信息同時幸免信用分析師或保險公司的個人主觀性。在美國,在同等信用機會法案下, 顯著的判不變量諸如種族、 性不、宗教信仰和年齡等都不能包括在信用評分模型中。只有本質上是非判不性的信息和那些被證實為對支付能力有預測性的信息才能包括在模型之中。信用評分同樣能夠關心我們增加貸款申請過程的速度與一致性,同時同意借款過程的自動化。同樣的,其大大簡化了信用評價過程中人工干預的必要以及分發信用的成本(Barefoot,1995)。憑借信用評分的關心,

5、金融機構在專門短時刻里能夠量化提供特不申請者與信用關聯的風險。Leonard(1995) 研究了加拿大的銀行,發覺在使用了信用評分之后,用于處理消費貸款申請的時刻由原來的九天縮短為三天。那么處理貸款申請節約下來的時刻就能夠用于從事更為復雜的問題。Banaslak and Kiely(2000)總結出在信用評分的關心下,金融機構能夠制定更快、更好和更高質量的決策。此外,信用評分能夠關心金融機構確定利息率,這些他們將對他們的用戶收費同時對資產組合定價(Avery et al.,2000)。高風險用戶將被提供更高的利息率,反之亦然?;谟脩舻男庞迷u分,金融機構也能夠確定對用戶設定信用限度(Sandl

6、er et al.,2000)。 這些都能夠關心金融機構更為有效的和有利的治理他們的賬戶。作為擴展,利潤評分則能用于在一系列產品中最大化利潤(Thomas,2000)。與上面談到的相關,信用評分模型實現了次一級借貸行業的進展,在那個地點,次一級的消費者具有不足的信用記錄同時不符合信用承諾與風險。他們可能因為信用缺陷、信用歷史記錄的缺失或者在確認他們的收入等方面無法滿足傳統金融業務的要求(Quittner,2003)。在次一級借貸的進展中,其中一個最要緊的因素差不多自動化的認購,其同意次一級抵押貸款能夠進行打包然后作為投資性有價證券來銷售。在這一市場專門金融機構的初始成功差不多驅動更多的金融機構

7、進入次一級借貸市場,期望伴隨著信用評分技術的前進而增長(Perin,1998)。最后,由于技術方面的進展,更為智能的信用評分模型得到了進展。相應的,信用卡提供者能夠使用由模型得到的信息來明確表示更好的策略,然后更為有效的使用這些資源。Lucas(2000)報告稱,收獲率(recovery rate)從1997年的9.1%,1998年的12.1%上升到1999年平均15.9%。此外,保險業應用信用評分來使得保險申請與續約過程更加簡化有效率。尤其是,信用評分關心保險公司作出關于索賠的更好的預測以及更為有效的操縱風險。他們同樣也能更準確的對產品進行定價。這使得保險公司能夠以更為公平的成本提供更多的保

8、險覆蓋面給更多的用戶,更快的對市場變化作出反應以及贏得競爭優勢(Kellison and Brockett,2003)。信用評分應用在最近幾年里,金融機構使用信用評分要緊是針對貸款申請作出信用決策。然而,在過去的25年里,信用評分的應用從制定信用決策開始向對與住房、保險、基礎公共事業服務甚至就業等方面制定決策轉移。然而,也并不是所有的應用差不多上得到同等廣泛的應用的。 信用評分最為普及的應用是在貸款申請中進行信用決策。除了在個人貸款應用上的決策之外,金融機構現在也開始利用信用評分關心設定信用限度、治理現金賬戶同時預測用戶與客戶的利潤度(Punch,2000)。例如,澳大利亞與新西蘭銀行集團 (

9、Australia and New Zealand Banking Group) 利用信用評分協助他們識不那些將同意信用的申請者, 決定申請者應該同意的信用數量,以及當在貸款支付過程中失敗時所應該采取的步驟。同樣,信用卡發行者使用信用評分作為決策支持工具識不他們信用卡的目標市場(這實際上確實是客戶贏得應用)(Punch,2000)。 在最近這些年里,信用評分同樣也在給小商業企業信用決策過程的部分程序中使用(Rowland,2003)。例如,Fleet金融集團(Fleet Financial Group)在低于10萬美元的貸款中使用信用評分。信用評分模型同樣也用于保險行業中(例如抵押以及汽車保險

10、),用于對新保險政策的申請以及現存政策的更新做出決策。應用的前提是:在金融穩定性與風險之間存在著直接的聯系。據討論得知在汽車與抵押保險方面的信用鑒定與損失比率之間都有專門強的相關關系。統計上的證據也證明了相對損失比率(關于索賠頻率與成本的函數)減少而信用等級鑒定改善(Schiff,2003)。GE Capital Mortgage Corporation使用信用評分關心他們甄不抵押保險申請表(Prakash,1995)。信用評分同樣用作調整年金的基準。一般地,具有差的信用得分的用戶會比具有專門好的信用得分的用戶擁有專門高的機率申請保險索賠。因此,前者都會被克以比較高的保險費。信用信息同樣也用于

11、在一項保險政策的條件下評價一個消費者的責任性以及行為。除了上面提及的之外,其他的信用評分的應用能夠在2002年美國消費者聯盟(The Consumer Federation of America) 的報告。比如,農場主能夠利用信用得分來判定潛在的農戶能否盡可能的及時支付他們的租金。美國的一些公共事業提供者同樣也應用信用得分決定是否對他們的消費者提供服務。最后,一些企業主利用信用歷史數據以及信用得分來決定是否雇用一個可能的雇員,尤其是對那些需要處理大量金鈔票的雇員的職位來講更是如此。其含意是雇員的誠信價值進而個人特性也能通過他們的信用得分進行評價。信用評分模型的構建構建信用評分模型的方法論通常包

12、含了以下過程。首先,選擇一個往??蛻舻臉颖就瑫r將他們分類成好與壞,要緊依靠在一段給定時刻里的支付能力來確定(為了簡化起見,那個地點僅僅使用兩分法)。 緊接著,從貸款用戶、個人和/或商業信用記錄以及能夠獲得其它不同的資源那兒收集數據(比如,信用局報告)。最后,統計或者其他定量的分析方法應用到這些數據上,產生信用評分模型。這一模型將包含應用到不同個體用戶變量(或屬性)上的權重以及分割點。應用到單個用戶或客戶變量的權重的總和構成了信用得分。分離點確定了是否那個用戶或客戶應該被分類為好的依舊壞的。更為準確與具體的是伴隨分類的概率同樣也能夠生成。需要注意的是,關于不同的數據的細分將構建成不同的模型。 到

13、此為止, 幾種技術差不多用于信用評分模型的構建了。 最為常用的技術是傳統統計學方法。例如, 一些最早建立的信用評分模型使用判不分析技術。 然而,判不分析需要相當嚴格的統計假設,這些假設在實際生活中是專門少能夠滿足的。相應的,Logistic回歸(相對不是專門嚴格)被推舉成為判不分析的替代方法。一些技術是往常就使用過的,然而不是相當頻繁,構建信用評分模型包括基因算法、K最近鄰值方法、線性規劃以及專家系統方法。 在最近這些年里,數據挖掘技術不斷增長的應用于構建信用評分模型。尤其是,決策樹方法差不多變成一種建立信用評分模型的流行的技術,因為得到的決策樹是專門易于解釋和形象化的。 進一步,神經網絡也是

14、普遍得到使用。這些技術在下面的文章中我們進行詳細討論。關于信用評分模型的經驗研究包括(Lee and Jung,1999/2000)和(West,2000)。應用數據挖掘技術進行信用評分 為了展示數據挖掘技術應用于信用評分,考慮一信用卡提供者,他們致力于建立一個信用評分模型來預測信用卡申請者的信用風險,并把他們分為有害損失、有害利潤、良好風險三種。信用卡提供者傾向于在信用卡申請者進行檢查時部署模型。假設所有的申請者都以申請表的形式提供以下的相關信息。 1.年齡; 2.年收入; 3.性不; 4.婚姻狀況; 5.家庭子女數目; 6.擁有其他信用卡情況; 7.申請者是否具有未完結的抵押貸款。 考慮到

15、上面涉及到的因素,目標變量為信用風險,輸入變量為上面列出的七個變量。在我們建立信用評分模型之前,信用卡提供者把代表性樣本中的4117一年期信用卡持有者用戶分成三類:有害損失、有害利潤和良好風險。同樣,作為常規的做法,申請者所提供的所有信息差不多上電子化自動收集的。 信用風險模型的構建需要建立預測性的模型技術。為此,三種數據挖掘技術是比較合適的,也確實是,Logistic 回歸、神經網絡和決策樹。我們在本文的例證中使用SPSS公司的 Clementine7.2(數據挖掘軟件)。 與本文例證相關聯的數據挖掘的圖表參見圖1。需要注意的是,在圖中包含了描述與可視化以及預測性模型。進一步,關聯與聚類關于

16、信用風險評分的應用并不相關,因此那個地點并沒有涉及。關于數據的快照能夠參見圖2。圖1圖2 描述與可視化結果 正如先前提及的,描述與可視化關于理解數據以及在初始建模過程中發覺模式、趨勢以及關系是特不有用的。 在本例證中使用了幾種描述與可視化的工具。其中一些結果被匯總在圖.3中。 例如,在Clementine中由統計節點生成的描述統計量,展示了在樣本中,平均年齡為31.82, 平均年收入為25580美元,家庭平均擁有子女數目為1.45個。另外, 3200或者是77.73%的信用卡持有者持有未完結的抵押貸款。盡管有些結果沒有顯示,仍然要緊注意的是,每個客戶平均擁有其他類型的信用卡為2.43張,207

17、7或者50.45%的客戶為女性,2089或50.74%為已婚。至于我們的目標變量信用風險,906(22.01%)的客戶為有害損失,2407(58.46%)的客戶為有害利潤,804(19.53%)的客戶為良好風險。這些描述性結果顯然有助于我們理解數據(也確實是信用卡申請者與持有者)。 圖3在Clementine中使用散點圖節點與直方圖節點來可視化數據,關于年齡與年收入的散點圖以及直方圖展現了客戶年齡與收入之間的相關關系。需要注意的是,在圖表中我們使用了信用風險狀況那個變量來交疊,反映目標變量的相關的可視化結果。關于結果的分析展示了年齡大與收入高的客戶以及持有相對較少其他信用卡的客戶表現出更為有利

18、的信用風險狀況。最后,利用Clementine中的網絡節點能夠繪制出反映性不、婚姻狀況、抵押貸款狀況與信用風險的聯系(見圖3下半部分)。其中聯系越為強烈的關系用更粗的線條來表示。假如聯系低于我們設置的某個門限,就可不能顯現在網絡圖中(比如良好風險與婚姻狀況)。網絡圖顯示出有害損失與是否擁有未完結抵押貸款有著中等程度的關聯,與女性、已婚信用卡持有者有著弱相關聯。正如早前提及的,描述與可視化關于建模來講是有用的。 預測模型結果在本文是用數據挖掘技術進行信用評分應用的展示中,預測性建模是最為重要的分析。特不的,Logistic回歸、神經網絡、決策樹都能夠用于購建信用評分模型。在實施預測性建模之前,樣

19、本數據首先要被分割為構建/訓練樣本集(大約占75%的數據)和評價/檢驗樣本集(大約占25%的數據)。為了簡化,我們假設模型的完全準確率是衡量各個預測性模型的要緊的性能指標。也確實是講,完全準確率是評價每個模型以及在模型間進行比較的標準。 圖4和圖5顯示了分不由Clementine中的Logistic回歸節點、神經網絡節點、決策樹節點C5.0生成的Logistic回歸模型、神經網絡模型以及決策樹模型的部分結果。Logistic回歸結果講明了模型在統計上是顯著的(基于0.05的置信水平)。 另外,正如圖4左下部分所顯示的,以下所列的輸入變量在預測信用風險上在統計上是顯著的:年齡、年收入、子女數目、

20、其他信用卡持有情況、婚姻狀況、是否持有未完結的抵押貸款。性不在統計上是不顯著的。關于模型的詳細的結果匯總在圖4的右邊。最后,關于Logistic回歸模型,完全準確率為72.7%。關于我們本文的例證來講能夠認為是足夠的了。 圖4 圖5(左邊部分)顯示了一個相對簡單的決策樹模型,擁有九個最終節點 (預測有害損失、有害利潤和良好風險)和五個重要的輸入變量:年收入、年齡、子女數目、持有其他信用卡數目以及婚姻狀況。關于決策樹模型的一個圖形化的描述展示在圖6中。 正如我們所看到的,決策樹既能夠特不直觀的解釋,也能夠依照規則進行解釋。例如,良好風險信用卡持有者可能是那些年收入高于25049美元同時不超過一個

21、子女的信用卡客戶以及那些收入盡管低于25049美元然而39歲以上且單身的信用卡持有者。決策樹模型的完全準確率為76.0%, 關于我們本文的例證來講也能夠認為是足夠的了。 圖5最后,圖5顯示了神經網絡模型,在模型中輸入層有九個神經元 (也確實是四個連續變量和三個分類變量),隱含層有三個神經元,輸出層有三個神經元(也確實是風險狀況有害損失、有害利潤、良好風險)。在神經網絡中,在輸入層中輸入變量的重要性以降序的方式排列為:年收入、持有其他信用卡數目、婚姻狀況、年齡、子女數目、是否有未完結的抵押貸款以及性不。神經網絡的完全準確率為76.6%,同樣關于我們本文的例證來講也能夠認為是足夠的了。 從上面展示

22、的模型的結果我們能夠注意到, 神經網絡模型是最為準確的。 然而,由于依據在構建/訓練數據集上的三個模型的性能是向上有偏的 (由于相同的觀看值被用于模型的構建與模型的評估),因此需要依靠評價/檢驗數據集來評價模型的性能是特不重要的。 相關結果匯總如下:Logistic回歸模型為71.1%,決策樹模型為74.2%,神經網絡模型為73.4%。 因此,決策樹模型的預測性能才是最為準確的,緊跟著是神經網絡模型和Logistic回歸模型。因此,依據我們的評價標準,決策樹模型是最好的(冠軍)預測模型,同時能夠用于我們對信用卡申請者進行信用風險的預測。然而同樣要注意的是,決策樹模型比較容易解釋, 就如在圖6中

23、所反映的簡單的規則證實的一樣。 圖6 信用評分的局限性 在那個地點的結論部分,我們討論一下信用評分的局限性同樣也是適合的。當構建信用評分模型是可能產生的一個要緊的問題時,模型可能建立在一個有偏的已獲信用準許的用戶或客戶樣本數據基礎上(Hand,2001)。這可能發生要緊是因為,那些被拒絕的申請者可能可不能包含在構建模型的數據庫中,因此就沒有機會來確知他們的信用價值性。因而,樣本將會是有偏的(也確實是不同于一般總體),其中良好的客戶大大的得到了表現。使用這一樣本得到的信用評分模型通常將無法在完全的總體中表現良好,因為用于購建模型的數據與將模型應用到的數據存在差異。 建立信用評分模型時可能產生的第

24、二個問題是,隨著時刻的過去,模式在發生變化。關于任何預測性模型的關鍵假設是,過去或者歷史能夠預測以后(Berry and Linoff,2000)。關于信用評分,這就意味著過去的那些隨后被分成好與壞債權人的申請者的特征能夠用于預測新的申請者的信用狀況。有時,隨著時刻流逝客戶特征分布的趨勢變化是如此快速,以至于需要不斷的更新信用評分模型來保持恰當性。 另一個在預測性模型中比較流行的問題是,模型中重要變量或屬性的缺失(Avery et al.,2000)。信用評分模型要緊使用的是個人支付與信用歷史的信息數據。這可能并不足以評價一個人的信用價值性。在本文的展示性信用評分模型中,某申請者的信用等級被預測為壞的,假如他或她的屬性與壞的客戶的觀看得到的特征相似。然而,信用違約可能是由那些諸如雇用狀況和現在的經濟狀況等未觀看到的(未測量的)特征所驅使的。進一步,信用評分的準確度比較關鍵的依靠于用于購建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論