基于數(shù)據(jù)挖掘技術的農村金融客戶評級的相關文獻調研(共11頁)_第1頁
基于數(shù)據(jù)挖掘技術的農村金融客戶評級的相關文獻調研(共11頁)_第2頁
基于數(shù)據(jù)挖掘技術的農村金融客戶評級的相關文獻調研(共11頁)_第3頁
基于數(shù)據(jù)挖掘技術的農村金融客戶評級的相關文獻調研(共11頁)_第4頁
基于數(shù)據(jù)挖掘技術的農村金融客戶評級的相關文獻調研(共11頁)_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于數(shù)據(jù)挖掘技術(jsh)的農村金融客戶評級的相關文獻調研小報告摘要(zhiyo): 近年來,我國的金融機構越來越重視自身(zshn)的信息化建設。農村金融機構在支持農業(yè)發(fā)展解決農戶貸款難,促進農民增收,發(fā)展農業(yè)現(xiàn)代化方面發(fā)揮了重要作用。而另一方面,其自身超過商業(yè)銀行數(shù)倍的不良資產率阻礙其在農村經(jīng)濟發(fā)展建設中的作用發(fā)揮。因此全面準確的評估農戶的還款能力,對農戶信用進行評級,拒絕不符合條件的客戶,將是各農村金融機構避免風險,減少損失的一個重要手段。而隨著社會經(jīng)濟的不斷發(fā)展,農村經(jīng)濟中“農戶”的概念外延不斷擴展,傳統(tǒng)的評價體系自身的問題尚未解決,已不適宜與用到現(xiàn)在的“農戶”概念。數(shù)據(jù)挖掘技術自上世

2、紀八十年代末提出之后,首先便被應用于金融與經(jīng)濟領域,并在信用評分模型構建中發(fā)揮著廣泛而且重要的作用。隨著數(shù)據(jù)的飛速膨脹數(shù)據(jù)倉庫的發(fā)展又促進數(shù)據(jù)挖掘更深入的應用。本次文獻調研的目的是梳理總結相關文獻中涉及評級體系構建的算法模型。關鍵字:信用評級,數(shù)據(jù)挖掘,算法模型;0.引言 農村金融機構(jn rn j u)一直以服務”三農(sn nn)”為宗旨(zngzh),有力地支持了“三農”經(jīng)濟發(fā)展,其自身也得到了較快發(fā)展。但由于內外因素的影響,部分農村信用社不良貸款“雙高”局面長期居高不下,不利于實現(xiàn)穩(wěn)健良性發(fā)展目標,同時也削弱了對經(jīng)濟發(fā)展的助推功能。2014年8月15日,銀監(jiān)會發(fā)布的初步統(tǒng)計數(shù)據(jù)顯示,

3、截至6月末,國有商業(yè)銀行不良貸款余額3957億元,不良貸款率1.05,而全國農村信用社不良貸款余額3809 億元,不良貸款比例為3.8%。而具體到省份,特別是信用貸款,據(jù)某省農村信用社統(tǒng)計,其2011 社轄內信用貸款約為580億元,其中不良貸款約為230 億,信用違約比達40%。不難看出農村金融機構進一步化解不良貸款、改善資產質量任務壓力較大。因此,如何借助科技的力量加強不良貸款管理,有效解決不良貸款問題是農村金融機構在改革發(fā)展過程所必須面臨解決的問題。農村金融機構與國外先進的商業(yè)銀行相比,點多面廣,管理難度大,不良貸款比例較高。目前雖然農村信用社建立了龐大的客戶信息庫和業(yè)務數(shù)據(jù),但是還局限于

4、對數(shù)據(jù)的存儲、記賬、查詢、報表功能等,把大量的數(shù)據(jù)作為一種靜態(tài)的檔案來管理,沒有把它當成一種重要的可以進行知識發(fā)現(xiàn)和決策支持的資源來利用,缺乏對其內在規(guī)律的挖掘,導致重要信息的流失和資源的浪費。但也為利用數(shù)據(jù)挖掘技術提供了可能。1.客戶信用風險評級(png j)方法的發(fā)展:最原始的評級方法是專家評分法,其所依據(jù)(yj)的信息最初是主觀評價,從3C 評價原則(品德Character、能力 capacity、擔保 collateral)到今天的5C和1S、5W評價原則。5C和1S,即特征(Character)、能力(Capacity)、資本(Capital)、抵押擔保(Collateral)、生活

5、狀況(Condition)、穩(wěn)定性(Stability)。5W,即借款人(Who)、借款用途(Why)、還款期限(When)、擔保物(What)及如何還款(How)。這些評價在內容上都十分類似,共同點都是將道德品質、還款能力、資產實力、擔保和經(jīng)營環(huán)境如何還款等要素逐一進行評分,讓銀行信貸人員對借款人的整體狀況有比較清晰的認識,信貸人員通過對借款人五個方面進行綜合評估,最后得出信用等級,根據(jù)信用等級以作為是否貸款、貸款標準的確定和貸后跟蹤監(jiān)測期間的政策調整依據(jù)。使用這種方法對評估人的綜合業(yè)務能力,專業(yè)水平要求較高,但農信社信貸人員素質普遍不高,在打分時有很大的主觀隨意性,造成評分出現(xiàn)較大偏差。信

6、用評分法將借款人的特征進行量化,形成一套指標體系,克服了主觀隨意性的風險。2.國外研究(ynji)現(xiàn)狀: 盡管大家都知道21世紀是數(shù)據(jù)挖掘發(fā)展的黃金時代,但在實際應用領域,數(shù)據(jù)挖掘的發(fā)展遠不如其在理論和技術方面的研究,數(shù)據(jù)挖掘的實際應用任重道遠。數(shù)據(jù)挖掘在金融信用風險預測方面,國外許多金融機構表現(xiàn)的很積極,但是由于金融信息的保密性,一般很少公布具體數(shù)據(jù)挖掘細節(jié)。但據(jù)美國軟件商提供的報告稱:FCC國家銀行、美國第一銀行、美聯(lián)儲、聯(lián)邦住房貸款抵押公司等重要金融機構都在致力于數(shù)據(jù)挖掘在金融系統(tǒng)的應用。主要運用以下五種方法:(1)、判別分析法 第一個把統(tǒng)計學方法運用于個人信用評估領域的研究人員是 Da

7、vid Durand,他把 Fisher提出的判別分析應用于個人信用評估,用來判別好客戶和壞客戶,它的原理是使用統(tǒng)計方法來對整體中的各個組的特征進行分類。William Fair和Earl Isaacs利用判別分析法建立了 FICO 評分系統(tǒng)。并成為如今主要的個人信用評分體系(tx)。FICO系統(tǒng)被認為是衡量個人風險的“黃金(hun jn jn)標準”。FICO 信用評分模型基本思想是把申請人的歷史信用資料與數(shù)據(jù)庫中借款人的信用習慣進行比較,來判斷申請人與違約、惡意透支、甚至申請破產等特征的借款人是否相似,是比較成熟和完善的信用模型。因 FICO 評分模型建立的基礎是發(fā)達(fd)的個人信用制度

8、,而我國目前由于個人信用制度還不完善,且FICO具體的評分模型和算法都不為人所知,在我國推廣的難度較大。(2)、回歸分析法 回歸分析法(包括線性回歸和 Logistic回歸)也是應用較廣泛的模型。Kasper Roszbach和Sveriges Riksbank利用線性回歸分析設計了一種評價未償還貸款的評分卡,用于評估消費信貸的信用風險。但是現(xiàn)行回歸方法用于信用評分存在明顯缺陷,即回歸方程兩邊變量(binling)的取值范圍可能不一致。Logistic 回歸模型則是對線性回歸模型的改進,回歸方程兩邊的取值可取任意值。Joachim Thaler和Stam意識到可以將線性規(guī)劃方法應用到分類問題。

9、Thomas從理論上把Freed和Glover 的線性規(guī)劃方法推廣到多目標線性數(shù)據(jù)分類方法,并成功應用于信用卡數(shù)據(jù)挖掘中。(3)、神經(jīng)網(wǎng)絡法 Odom首次將神經(jīng)網(wǎng)絡的方法引入信用風險評測中,Edelman用多感知器神經(jīng)網(wǎng)絡模型來預測銀行的存款和貸款的穩(wěn)健度。Sarle等用神經(jīng)網(wǎng)絡來分析客戶的信貸指數(shù)。神經(jīng)網(wǎng)絡方法得到研究者和學者的廣泛關注,已被證明是一種可以普遍使用的方法。雖然神經(jīng)網(wǎng)絡用于信用等級分類取得了一定的效果,但它最大的缺點在神經(jīng)網(wǎng)絡模型缺乏較好的可解釋性和理解性,造成了使用上的困難。Corinna and Vapnik提出的支持向量機在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有

10、優(yōu)勢,解決了在神經(jīng)網(wǎng)絡方法中無法避免得到局部(jb)極值的情況。Martens將 SVM 用于判別規(guī)則的提取中,使得信用評分模型具有更好的可解釋性。(4)、遺傳算法 遺傳算法是一種通過模擬自然進化過程搜索最優(yōu)解的方法。Greene和Smith把 GA 運用到了信用風險評估中,但在實際應用中遇到了困難,在于 GA 中定長編碼機制在處理(chl)復雜問題特別是包括連續(xù)性變量時編碼過長,耗費機時。Koza改進了GA算法,提出了GP算法(遺傳規(guī)劃法),克服了定長編碼機制的局限性。(5)、決策樹算法(sun f) 決策樹算法第一次由 Makowski應用于個人信用(xnyng)評分。此后 Sewarta

11、nd Whittaker則用決策樹來對信用進行預測。近來,Lee等運用決策樹技術研究最小化信用風險問題。 3.國內研究現(xiàn)狀: 國內對信用評分的研究也經(jīng)歷了從定性研究為主,到定性和定量相結合的過程。傳統(tǒng)的研究多以主觀的專家判別法為主,以銀行從業(yè)專家以及信貸員的經(jīng)驗為主要依據(jù),如中國郵政儲蓄銀行信用評級二級指標有 15 項,其中定量指標有 9 項,權重為61,定性指標有6項,權重為39。雖然評估因素相對全面,并注意了信用評分方法的實施,但是評估主觀因素影響依舊較大,缺乏合理性與公平性。定性指標所占權重仍然較大,且標準不一,信貸人員評估水平高低直接影響信用評定的好壞,導致信用評級不但沒有擴大可以獲得

12、貸款的農戶比例,反而把許多農戶阻擋在信用戶稱號之外,讓他們更得不到貸款。目前國內學者構建信用評分模型采用的技術大部引進國外。 與國外金融機構和軟件生產商對金融數(shù)據(jù)挖掘的研究勢頭相比,由于市場經(jīng)濟結構,商業(yè)銀行發(fā)展年限較短等原因國內在這方面的發(fā)展研究還處于起步階段。信用風險評測方面的短板很有可能影響到未來商業(yè)銀行貸款業(yè)務的發(fā)展。近年來,國內在金融風險評級方面的數(shù)據(jù)挖掘研究也在逐漸增加,例如(lr),運用BP神經(jīng)網(wǎng)絡技術、運用向量機、運用Apriori算法對信用風險進行評估預測,也有運用Logistic回歸模型構建違約概率測算模型。盡管研究很多,但是投入實際應用的很少。關于決策樹算法(sun f)

13、及時間任務分配 經(jīng)文獻調查發(fā)現(xiàn),信用評級的研究多涉及金融、計算機與數(shù)學的結合(jih)。期刊類文章偏向于對算法的研究。碩博論文則更多注重評級體系的計算機系統(tǒng)實現(xiàn)。 下圖為基于(jy)數(shù)據(jù)挖掘技術客戶信用風險評級體系的結構框圖。目前(mqin)運用較多的數(shù)據(jù)挖掘算法是決策樹算法,神經(jīng)網(wǎng)絡算法以及譜聚類算法,其中對決策樹算法的研究文獻較為豐富。(1)、決策樹算法(sun f) 在諸多分類方法中,決策樹是一種常用!直觀的快速分類方法決策樹分類方法采用自頂向下的遞歸方式,在決策樹的內部節(jié)點進行屬性值的比較并根據(jù)不同的屬性值判斷從該節(jié)點向下的分支,在決策樹的葉結點得到結論。最經(jīng)典的決策樹算法是ID3算法

14、,其核心思想是在決策樹的構建過程中采取基于信息增益的特征選擇策略,即選取具有最高信息增益的屬性作為當前節(jié)點的分裂屬性,使得對結果劃分中的樣本分類所需要的信息量最小以此構造與訓練數(shù)據(jù)一致的一棵決策樹,從而保證了決策樹具有最小的分支數(shù)量和最小的冗余度。但由于存在搜索工程中無法回溯等問題,現(xiàn)今所采用的算法多是從ID3發(fā)展而來的C4.5及C5.0算法。(2)、時間(shjin)任務分配 時間有限未能對各類算法有深入了解,并且只對中文文獻做了粗淺閱讀。所以將接下來的任務主要放到文獻調研以及對決策樹算法的理解與掌握,將重點放到框圖中評級分類模型模塊。結合自身實際制定(zhdng)未來四周時間任務分配表。一

15、二三四五六日周工作安排24252627282930311外出繼續(xù)文獻調研,一周一篇外文文獻2外出3外出4外出5678了解決策樹模型的基本思想9101112131415信用評級的理論要求及決策樹算法閱讀(ID3,C4.5,C5.0)16171819202122信用評級的理論要求及決策樹算法閱讀(ID3,C4.5,C5.0)5.SIPT題目(tm)分級過程中的決策樹算法研究決策樹算法與神經(jīng)網(wǎng)絡算法在分級過程中的比較分析6.選題原因 針對數(shù)據(jù)的分級系統(tǒng)在國內尚處于起步階段,更多還停留在算法的研究上。農村金融機構正在向信息化邁進,并且有大量的數(shù)據(jù)等待開發(fā)整理,為數(shù)據(jù)挖掘技術的應用提供了可能。當社會(s

16、hhu)的信息化程度邁向大數(shù)據(jù)時代后,對信息分級評級的需求量會大大加大,而不僅僅是金融機構。目前更多針對金融系統(tǒng)的信用評級體系在大數(shù)據(jù)時代會有更大的拓展空間。7.參考文獻1王貝.農戶(nngh)借貸特征及影響因素實證研究D.山東大學,2014.2李炎.大數(shù)據(jù)(shj)時代銀行業(yè)監(jiān)管手段的探索D.西南財經(jīng)大學,2014.3葉曉明.數(shù)據(jù)挖掘技術在農村商業(yè)銀行信貸的應用研究D.中南大學,2013.4張成.數(shù)據(jù)挖掘技術在金融審計中的研究與應用D.安徽大學,2014.5田野.基于相似性挖掘的金融數(shù)據(jù)分析系統(tǒng)的研究與應用D.上海交通大學,2012.6鄭曼.基于SAS系統(tǒng)的稅務數(shù)據(jù)挖掘研究D.鄭州大學,2012.7王超.基于數(shù)據(jù)挖掘的農信社不良貸款臺賬管理系統(tǒng)設計與實現(xiàn)D.湖南大學,2014.8龍亞平.數(shù)據(jù)挖掘在農信社客戶關系管理中的應用研究D.湖南大學,2012.9文遠波.數(shù)據(jù)挖掘在農村(nngcn)信用社信貸管理中的應用D.湖南大學,2012.10高祖康.基于數(shù)據(jù)挖掘的商業(yè)銀行貸款信用(xnyng)評級D.南京理工大學,2013.11蔡皎潔,張玉峰.基于數(shù)據(jù)挖掘銀行客戶信用風險評級體系(tx)研究J.情報雜志,2010,02:47-50+71.12鞏吉璋.決策樹分類算法在銀行個人信用評級中的應用D.暨南大學,2008.13沈術.決策樹算法在農村

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論