分析:大數據能否帶來風控革命_第1頁
分析:大數據能否帶來風控革命_第2頁
分析:大數據能否帶來風控革命_第3頁
免費預覽已結束,剩余35頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

分析:大數據能否帶來風控革命

對大數據我不是專家,但由于大數據也是開放性的命題,所以我也就自己的認知水平,談談我對大數據的看法,更多集中在數據的金融應用上。第一節(jié)什么是大數據一、大數據并非新事物早在1980年,著名未來學家阿爾文·托夫勒就在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮”。不過,直到2009年前后,“大數據”才成為互聯網信息技術行業(yè)的流行詞匯。2013年,隨著互聯網金融的空前熱門,也才真正意義上將“大數據”推到了高潮。如果探究互聯網金融與大數據流行之間的關聯,背后有一個很關鍵的因素,就是互聯網金融一直無法解答一個核心命題——風險控制。即互聯網沒有找到比傳統(tǒng)金融更具優(yōu)勢的風控方法,從而使得互聯網金融在興起的過程中飽受質疑。而橫空出世的大數據成為了互聯網金融支持者的一個重要精神支柱。大數據越不可測,就越具備想象力,對互聯網金融而言,就越具解釋力。那么什么是大數據呢?我談談自己的看法。大概四五年前,美國《商業(yè)周刊》資深作家約翰·伯恩一本暢銷書《藍血十杰》,對今天中國互聯網金融和大數據理論愛好者們產生了極大的影響。這本書講述了十個年輕人,出身名校哈佛,心懷理想,是天才中的天才。他們二戰(zhàn)期間成為了美國空軍的后勤英雄,卓有成效地將數字化管理模式應用于戰(zhàn)爭,為盟軍節(jié)約了十億美元的耗費,幫助盟軍取得了勝利。這說明數據的分析和管理,很早就被用于國家戰(zhàn)爭和商業(yè)運營了,為什么現在非要在數據前面加個“大”字呢?上次在鴻儒論道,聽社科院何帆教授的課程,他提到,從本質上講一切的社會現象都是統(tǒng)計現象,并不像實驗室里的試驗那樣有明確的因果關系。如經濟學的供求定理就是一個統(tǒng)計規(guī)律。但是人類認知能力中最差的也是統(tǒng)計思維。諾貝爾獎得主、心理學家卡尼曼曾經講過,人類頭腦中有兩套思維。一套思維是本能的,比如我們的語言能力、模仿能力、第六感,等等,都是與生俱來的。如麻省理工學院的語言學家喬姆斯基指出,小孩子為什么到3歲就能學會說話,而要到十幾歲才能學會微積分呢?語言學得這么快,不是小孩子自己能學會的,是他出生時大腦中就預裝了一套系統(tǒng)。此外,察言觀色的能力也不用特意學或教,小孩子就已經會了。所以這是人類的第一套系統(tǒng),也是能夠讓我們快速反應的系統(tǒng)。第二套系統(tǒng),是當我們做數學推理,尤其是統(tǒng)計分析時需要用到的。第二套系統(tǒng)運轉很慢,因為占的內存太大,往往我們犯錯誤就是因為決策太快,在統(tǒng)計判斷的方面出現問題。所以,我們在談大數據的時候,都認為是個新潮的概念,但是作為方法論而言,大數據已經有很長的歷史了。那為什么現在大家突然講大數據了呢?主要是因為現在的數據越來越多,一方面隨著IT革命,存儲和計算能力在不斷提高,未來可能會出現無限存儲、瞬間計算的新時代;另一方面,能夠被數據化的東西也越來越多,過去只有數字,而會計制度出來后,經濟活動開始可以通過記賬數據化。現在大家拿的pad和電子閱讀器中的文字、圖像也是數字化的。隨著能夠變成數據的東西越來越多,計算和處理數據的能力越來越強,大家突然發(fā)現這個東西很有意思。一旦把統(tǒng)計學和現在大規(guī)模的數據融合在一起,就會顛覆很多我們原來的思維。二、大數據就是非相關數據的相關性現在大數據被說得神乎其神的一個重要原因,是普遍認為大數據可以有效推演和設定未來的走向,極為精準地推斷某些事件出現的概率,體現在金融業(yè)里,就是可以很好地控制風險。那么,真的如此嗎?寫于1942年的科幻小說《銀河帝國》,就講述了在銀河帝國最繁榮的時候,國內最有才華的數學家謝頓說他能夠預知未來歷史的變化以及潛在的危機,只要數據量足夠大。當時的人口已經是上萬億,足夠他準確預測未來的變化。所以謝頓悄悄建了一個“基地組織”,還有“第二基地組織”。當出現所謂的“謝頓危機”時候,大家就把他事先錄好的錄像調出來,他在錄像里會闡述已經預測到的此次危機及其99%的可能性,并告知人們要怎么做。書里的謝頓教授首先是個數學家,同時也是個心理學家。他從上千兆的社會民眾中進行行為心理學的樣本分析,來推斷社會的演變。他把各種偶發(fā)性因素都設立了變量的幅度范圍,一旦出現異變就予以撲殺,以使社會回歸到設定的進程去。他也做了一些基本的定義,這些定義都隱含了一個社會假設,那就是“作為研究對象的人類,總數必須達到足以用統(tǒng)計的方法來加以處理,還有一個必要的假設是群體中必須沒有人知道本身已是心理分析的樣本,如此才能確保所有的反應都是真正的隨機”??梢钥闯?,大數據的意義在于從海量的數據里尋找出一定的相關性,然后推演出行為方式的可能性。從這個角度來看,很多人所談的大數據是相關數據的優(yōu)化和整理概念,壓根不是一回事。何謂非相關數據的相關性?比如說公共衛(wèi)生領域,研究傳染病是很難的,因為發(fā)病快,病人馬上就死了,很難像癌癥那樣去研究它的病理學是什么。那最后是怎么發(fā)現傳染方式的呢?以霍亂為例,實際上就是有兩張地圖,一張是得霍亂病人的分布圖,另外一張是倫敦市水井的分布圖,最后發(fā)現兩張圖之間有一些聯系規(guī)律,所以覺得可能跟飲水有關。在科學不發(fā)達的過去,我們是通過水井跟霍亂這兩種非相關數據的分布尋找到了相關性,雖然不知道為什么,也無法解釋,但是卻能做出較好的防范。這種非相關數據的相關性是偶然發(fā)現的,并非刻意尋找的結果。原因在于過去沒有數據匯集技術,導致數據量太少,根本無法對非相關數據進行集中比對。另外一方面也是因為數據的處理能力有限,即使數據匯集了,也無法有效進行數據處理,要找出各種數據的相關性的手段極為有限。所以,過去的數據挖掘也好,數據分析也罷,更多還是對帶有相關性的數據的整理和分析,事前都是有邏輯作為基礎的。包括《藍血十杰》里面的行為,也包括阿里金融的所謂大數據風控等,本身就是可推導的數據,在此之上進行概率計算。如果這些都定義為大數據,那么大數據就不是什么新概念。要講大數據,必然是海量的不同維度數據的相關性分析,對于本身具備相關性的數據,頂多稱為數據優(yōu)化罷了。我自己覺得,大數據的出現更多是基于兩個方面:第一是互聯網使得數據產生量大大增加,有了現實的不同數據的比對和處理的可能性;第二是計算能力大幅度提高,原先單一的中央式計算方式變成了以云計算為特征的分布式計算方式,使得處理能力海量增加,最終可以把統(tǒng)計學和現在大規(guī)模的數據融合在一起,從而發(fā)現很多有意思的事情。一方面是發(fā)現了很多有相關性的事件,但是不知道為什么相關;另外一方面是發(fā)現很多原先認為是沒有關聯的事情,原來內在都是有聯系的。最終可以成為我們決策的依據,大大提升我們的管理效率或者處理事情的能力,也極大地顛覆我們原來的思維。我曾開玩笑說,我們最早的大數據思維是什么呢?是周易衍生出來的命理學派,絕對是大數據的思維。你算個卦,然后說某個人晚上死,他就死了。兩者沒有任何的關系啊,但是從統(tǒng)計結果來看,往往就是準確率極高。是什么維持了兩者相關,很多時候有因果關系,很多時候無因果關系,當然也可能是還不知道的無法驗證的因果關系。我在《支付革命》里提出過,少扯大數據,多談小數據。為什么呢?因為大數據要盡量收集更多的非相關數據,來計算其相關性,必然帶有極大的成本和結果的不確定性。成本大,是因為數據收集成本和整理成本都很高;結果不確定,是因為都是非相關數據,你之前是很難確定這些數據的相關性的,需要不斷碰撞和測試,不但耗費成本,而且很可能窮盡之后發(fā)現,這些數據真的是不相關,所以投入和產出就經常極不對稱。上次碰到惠普的副總裁提大數據的概念,他說,按照他們的理解,全球有能力進行所謂大數據應用的公司不會超過50家,我自己的推測也差不多。很多公司即使可以用大數據,往往所獲得的收益也根本不足以覆蓋巨額的成本。我在一次峰會上聽到很多P2P公司在說,它們可以通過業(yè)務沉淀出極大的數據,然后用大數據技術來提高風控質量。這叫啥?叫典型的無知者無畏。第二節(jié)大數據與“黑天鵝”事件一、大數據的相關性基礎條件“一句話,即便在大數據時代,種種‘黑天鵝’事件也仍然是沒有辦法被準確預測到的。因為所有根據過去的理論數據模型進行的假設都無法準確推演未來,它們不過是為了未來某個黑天鵝做著準備。”大數據涉及海量非相關數據的相關性的統(tǒng)計,其相關性的存在基礎又是什么呢?非相關數據,很多時候兩者的相關性是真相關,也可能是偽相關。需要注意,這種相關性要成為可推演的行為邏輯,首要前提就是確保這種相關性的基礎是恒定不變的。再以前文霍亂與水質關系為例,這里存在一個基礎前提,就是霍亂弧菌在水中存活時間較長,有些菌株還可以在水中越冬。所以一次污染后有可能使水體較長時間保持傳播能力。而且,當水棲動物被污染后,霍亂弧菌有可能在其體內存活較長的時間,繼續(xù)污染水體。所以,經水傳播的特點是呈現暴發(fā)狀態(tài)。如果這個霍亂弧菌不是通過水傳播了,那這種相關性就消失了。因此,我們要注意和警惕的是,大數據并非是一個萬能的事物,它的缺陷在于立足于統(tǒng)計學基礎之上,必然是會因為統(tǒng)計樣本的變化而發(fā)生變化的。尤其在適用于人群分析的時候。拿前面的《銀河帝國》來舉例,把社會公民作為樣本來進行分析,通過過去的樣本行為,得出未來的可能結論。這里的理論基礎是,在人群的社會性特征不發(fā)生改變的情況下,作為社會構成的絕大部分人,思考問題的方式不會有太大的差異,行為邏輯也是相對固定的。如果是將一個人特列出來,可能很有個性,但當人口樣本數量足夠大時,就會發(fā)現其實每個人都是一模一樣的。但是要注意,這個理論成立的核心前提是,社會性特征要保持不變。因為只有在相對穩(wěn)定的基礎性環(huán)境里,被列為樣本分析的群體才會是一致行為邏輯。在基礎性環(huán)境發(fā)生變化的情況下,人的行為跟過去必然是不同的。一個簡單的推論是,如果一個人未來做的事情跟過去一致,那么這個社會必然是不發(fā)展的。因為即使有人做出了創(chuàng)新性突破,但是當社會多數群體都拒絕創(chuàng)新使用的話,社會還是停滯的。因此,在一個發(fā)展的社會里,社會群體必然是不斷改變其行為模式的。而一旦行為模式改變,所有過去的數據積累所構建的相關性都會消失,因為人們不再按照過去的生活習慣進行生活了。當然很多人會說,社會前進,必然使得數據也是前進的,所以還是可以用新的數據來推斷未來。這里的悖論在于,由于大數據的核心是通過分析過去而判斷未來,隱含的前提條件必然是未來跟過去的基礎性特征一致。而且,數據由于需要海量積累,匹配處理后的推論結果永遠是慢于社會前進的步伐的。二、過去能否決定未來所以,問題的焦點在于,過去是否一定能決定未來?如果大數據無法解答這個命題,那么它必然在很多領域是失效的。我們先看一個簡單的堆沙子的實驗。在海邊堆沙子,無論你怎么堆積,必然是要倒塌的,問題在于什么時候倒塌?通過數學模型一直無法測算出精確的結果,也就是無法計算出到第幾粒沙子的時候,沙堆就會倒。這里如果用過去決定未來的邏輯進行推演,第1粒沙子沒倒,第2粒沒倒,第3粒沒倒……第1000粒也沒倒,我們可否有效認定,第1001粒就不會倒了呢?事實上,過去的每粒沙子的往上堆積,都是在為最后一粒沙子的倒塌做準備。過去幾年的金融危機告訴我們,原來的經濟學、金融學理論都存在巨大缺陷。按照傳統(tǒng)的標準正態(tài)分布狀的金融學模型,2008年的金融危機大概250億年才會爆發(fā)一次,地球都沒有那么長的壽命,怎么就讓我們趕上了呢?為什么打開新聞,遇到了50年不遇的旱災,100年不遇的水災,歷史上從來沒有過的霧霾天氣,等等,怎么都讓我們趕上了呢?這種黑天鵝事件即使在大數據時代,也仍然是沒有辦法預測的,因為這些數據都是為了未來某個黑天鵝事件做的準備。在《黑天鵝》這本書里面,有一句非常好的話:“你不知道的事情比你知道的事情更重要。”在以前,很多東西我們沒有辦法把它數據化,也沒有辦法把它預測出來。但現在,數據足夠多,它會給你一種幻覺,讓人覺得能找到看得見、摸得著的規(guī)律,讓人們覺得有足夠的能力把握未來。但往往在人們過于自信的時候,會犯更大的錯誤。到目前為止,越是大的系統(tǒng)性危機,人們越束手無策。美國金融危機爆發(fā)后,美聯儲前主席格林斯潘到美國國會去作證,他說,“我發(fā)現了一個缺陷,但我不知道它有多么嚴重,也不知道它會持續(xù)多久,這件事情使我深感苦惱?!庇幸粋€國會議員馬上打斷他,說:“格林斯潘先生,你的意思是不是說你根本不知道為什么會發(fā)生這次金融危機?”格林斯潘說:“是的,因為在過去40多年甚至更長的時間里,我都有非常雄辯的證據證明我的做法會如愿以償?!边@么大一場危機到來了,美聯儲的掌舵人卻不知道為什么會發(fā)生金融危機!所以在未來,真正需要我們高度警惕的是,即使你有了大數據,也沒有辦法完全知道系統(tǒng)性的風險和危機,例如“黑天鵝”事件。事實上,人類歷史的場合中,黑天鵝事件的層出不窮,已經是被驗證的定論,社會的每一次技術突破,其實就是黑天鵝事件。也就是說,黑天鵝事件,本來就是人類自我創(chuàng)造和努力的結果。牛頓莫名其妙地被蘋果砸了頭,創(chuàng)造引力理論,然后極大地改變了社會的發(fā)展邏輯,使得人類呈現不同的生活方式,從而使得過去所有既定的規(guī)則都發(fā)生了變化,而事實上,人類社會已經表現出了加速進化的趨勢,這個趨勢還在加速過程之中,技術的迭代更新更加迅猛,最終使得過去決定未來的可能性越來越小。從秦朝到清朝的上千年時間里,事實上人類生活是沒有發(fā)生太大改變的,都是日出而作、日落而息的農耕主導型社會,而大工業(yè)革命之后的社會,以及電氣化時代的來臨,加速了社會進化過程,時代周期的縮短已然是個趨勢,幾千年的時代周期立刻壓縮為十年為單位的周期,甚至更短,因此使得人類的生活方式更呈現出差異化和偶然性。過去決定未來,是無法反映出時代進步和調整的可能性的。過去所做的推斷,永遠只代表了過去那個階段為止的最高極限,本身是不會自我演化和發(fā)展的。很多年前,我寫人工智能的文章,就提出過一個假象的理論模型,倒是跟大數據有點類似。因為所有的前提都是建立在當時的極限值上,所有的推演變化其實都在過去的科技水平之上,所以,人工智能永遠只能達到生產者那個階段的智力水平,它本身無法改變這個局限而實現自我進化。這必然決定了它要依附在生產制造它的群體的進化之上,只有如此,它才可能繼續(xù)進化。這里也可以提下,其實從人生歷史上看,還有一條進化之路,其實是通過相互對抗而不斷進化,對抗性的存在其實也是進化的基礎。人類的進化就是通過不斷消滅別的物種的過程來實現的,這就可以得出這樣一個結論,如果把競爭對手都搞死了,其實我們也失去了進化的可能性。三、信號與噪音一個數據分析師寫過一本書叫《信號與噪音》,其中講到真正的信號是有用的信息,還有很多沒用的信號是干擾決策的噪音?!拔覀兛傆X得信息量越大,能夠得到的真理就越多。其實不是的,信息增長的速度要遠遠快于真理增長的速度?!彼圆灰詾槟愕臄祿蕉?,就能離真理越近,有時候信息越多,噪音越多,反而干擾決策。換句話說,知識的邊際收益是遞減的。因此,在“過去決定未來”的這個邏輯上,需要明確幾個方面:一、經濟生活加速,技術革命隨時到來的情況下,穩(wěn)定期限到底能維持多久;二、判斷主體的前提是主體不知道自己被作為樣本;三、社會生活中,穩(wěn)定的群體是誰?不穩(wěn)定的群體是誰?穩(wěn)定的群體更容易被樣本化而呈現可推演性。不穩(wěn)定的個人意志往往改變社會,腦殘和精英主導了社會的前進;四、人會因為未來而改變過去的可能性到底有多大?在投資領域,我引用雪球網友給我的文章做的評論里的一段話做個附文,感覺寫得很不錯。他將統(tǒng)計學運用到投資領域,大數據理論還延伸出不少著名的投資理論和投資實踐。比如施洛斯的低估值投資方法,便是提高投資成功率的真知灼見之一。沃爾特·施洛斯認為,投資是一件簡約的事情,長期投資=正確決定(低估值+成長性)+時間??偠灾?,學會用概率統(tǒng)計思維和非線性復雜性思維進行思考,對投資是有好處的。有的行業(yè)更加穩(wěn)定,變化緩慢,投資預測時更容易有確定性,這也是傳統(tǒng)投資大師最喜歡的行業(yè)。而有些行業(yè)則更加不可預測,適用非線性物理學的能量法則,而非概率統(tǒng)計的正態(tài)分布?!蹲頋h的腳步——隨機性如何主宰我們的生活》里提到:“如果電影票房按正態(tài)分布,那大多數電影賺到的錢都該落在某個平均值附近,有三分之二的電影票房,將落在這個平均值周圍一個標準差的范圍內。但在電影業(yè)中,20%的電影帶來了80%的票房收入。這類由熱點驅動的產業(yè),盡管完全無法預測,卻遵循了一個完全不同的分布,其中均值和標準差的概念毫無意義?!边@些對于我們的投資有哪些啟示呢?1.投資于變化緩慢或者容易預測的行業(yè),也就是更加符合正態(tài)分布的行業(yè),避開高科技、娛樂、文化等非正態(tài)分布的行業(yè)?!逗谔禊Z》一書提出的反脆弱性,是另外一種思路,也可以借鑒。2.即使是對于非正態(tài)分布的行業(yè),基于低估值的大數法則也有用武之地。例如獅門影業(yè)就是典型,它只專注于小成本的幾個細分市場,例如恐怖片、禁忌片等,每次電影制作成本都很低,虧了問題不大,但若有幾個成為blockbuster,它就賺大了。至于航運企業(yè),那些活得久的老家伙都很保守,只在低迷時期造船,也是類似的道理。銀行業(yè)其實不是好行業(yè),不具備《黑天鵝》作者所述的反脆弱性。老巴投資的富國銀行是唯一的例外,它最保守。如果比爾·米勒明白這個道理,他就不會抄底雷曼了。在比爾·米勒看來,“護城河”最寬的地方就是20世紀30年代大蕭條,“難道我應該在假設中設置一項,‘假設有朝一日我們回到奴隸制’么?”比爾·米勒如果真正明白了他號稱經常研究的混沌理論、非線性動力學、復雜性理論,他就應該對金融業(yè)的黑天鵝有深刻認識,從而遠遠避開這個行業(yè)的公司,除非是富國銀行這個少有的奇葩。但他貪圖便宜抄底雷曼,是典型的知行不一。3.即使有上述兩條,還是要明白,最關鍵的是運氣,大勢勝于一切。適者生存,適應的是環(huán)境,環(huán)境變了,勝者也會變化。所以,要時刻關注假設和前提的變化,關注規(guī)則的變化,關注邊緣地帶。因為創(chuàng)新都來自于邊緣地帶,要關注顛覆式創(chuàng)新。那么如何才能發(fā)現邊緣地帶?必須不斷學習,時刻否定自己,學會擁抱變化?!吨苓呉曇啊綔y引發(fā)公司成敗的弱信號》里提到,金寶湯公司(CampbellSoup)的前任營銷總監(jiān)梅爾基奧雷說:“我所見過的成功人士所做的最重要的一件事,就是他們把每一天都當作全新的一天去體驗和學習。我拋開所有以前的想法,當作自己一無所知地去體驗每一天。讓人們失敗的真正原因是,是他們確信自己已經知曉如何做事,每天只是花費時間來驗證他們的觀點而已。我從來不認為我已經掌握了全部答案。我經常會把人們的怪異想法作為參考,比如,如果我們使用卡車來運送玉米餅或者水果會怎么樣呢?如果你被困在原有的思維模式中,你就不會擁有廣闊的視野,你的視野就仿佛是坐井觀天,看到的是井口那么大的天地?!眮嗰R遜創(chuàng)始人貝佐斯說:“聰明人會持續(xù)修改他們對特定事物的理解,重新考量先前已解決過的問題。聰明人也對新觀點、新資訊和挑戰(zhàn)他們既有思考模式的想法抱持著開放的態(tài)度。”貝佐斯鼓勵大家擁有暫時而不是永久的想法,保持彈性以作改變。他說:“想法錯誤或做錯決定的那些人,總是過度執(zhí)著于只能支持某一特定觀點的細節(jié)。而懂得思考的人會不斷地省思,并對其他觀點抱持開放的心胸?!薄秳?chuàng)造性破壞》里指出,具備路易斯·巴斯德所謂“心理準備”的人,才會關注到異常現象的存在。“亞歷山大·弗萊明不是第一位發(fā)現細菌培養(yǎng)器皿受到霉菌孢子污染的人,卻是第一位注意到附著在那一層膠化物體上面,明顯的環(huán)狀絨毛斑點所具有的更深層意義的人”。四、被移動互聯重構的社會接下來,我們進一步來論證“過去是否能決定未來”這個簡單的命題。通常情況下,絕大多數人的行為其實都是按照某種規(guī)律進行的,也就是過去如何做,未來也一般會如何做。例如平時早晚會有出行高峰,周末CBD的人很少等等,都反映了社會人群的行為邏輯是可推演、可預測的,只要數據量足夠大。但是這里有兩個非常重要的假設性前提:一是社會現實的基礎未發(fā)生大變化,另外一個是你所應用的群體,必須是樣本的主體。先來看前提條件一,平時早晚會有出行高峰,是因為大多數人都是朝九晚五地上班,但是如果明天戰(zhàn)爭來了,還會是如此狀態(tài)么?必然不是,戰(zhàn)爭把原先的社會基礎給打破了,人的行為邏輯必然也就發(fā)生改變了。再按照過去的數據推演就無效。再來看前提條件二,更簡單,你如果用早晚出行高峰去預測我的行為,那就一點成功的可能性也沒有,因為我都是白天睡覺、晚上上班,我就屬于樣本分析群體里的異類,屬于那部分不呈現樣本分析的群體性特征的人。我們從這兩個前提出發(fā),第一,那些打破基礎性環(huán)境的所謂黑天鵝事件,頻繁么?可測么?我自己感覺是不可測,并且會越來越頻繁。從而得出結論,未來社會中群體性可預測的事情會越來越少,尤其是移動互聯網興起之后。在移動互聯網出現之前,人類社會骨子里還是個部落族長制社會,這種社會的特征是需要絕大多數人形成共同的價值觀,然后基于此來展開社會分工協作。即使你不認同這種共同的價值觀,一種被稱為法律或者道德的東西,也會迫使你按照這種規(guī)則做事情??傊?,一旦形成了主流價值觀的趨勢,你只有接受和不接受的權利。由于這種價值觀在一定時期是固定的,這就使得社會整體的行為邏輯是可以很大程度上被推演和歸納的。所以,我們會發(fā)現在國家和民族內,都有共同的生活習慣,盡管很多生活習慣是被強加的,并不代表認同。在過去的社會里,你如果是一個生活在群體性特征下的異類,你的前途基本上很渺茫,會被不斷地邊緣化,處于自生自滅的境地。當然這個還算好的,如果你要反對這個社會的主流價值觀,你的下場一般就是哥白尼之類的了。當然也有極個別的成功案例,就是被邊緣化和不認同后,通過他自己的努力或者是運氣,不但活下來了,還活得挺好。畢竟這樣的人真不多。但是互聯網出現之后,情況有了很大的變化。一個被自己原先所在群體邊緣化的人,通過互聯網,往往能找到另外一些和他一樣被群體邊緣化的人,然后一拍即合,構建起一個新的群體。所以從這個角度來看,互聯網其實是極大地促進了社會群體的分化。社會更趨向多元化的分布,主流價值觀會被打破,越來越多的價值觀會涌現。這就使得對群體性行為的預測難度加大,就算每個群體的行為都可以被預測,但所有群體疊加之后整個社會行為的預測難度會很大。互聯網時代,價值觀的對錯與否不再是唯一標準。個體對于所謂的價值認定也出現極大分化,一個人認為很沒價值的東西,就有人做出完全不同的判斷,主流價值觀不斷被分化。最典型的就是成功學,這個主流群體可能認為毫無價值的東西,其實受眾遠遠多于批判的人。以前我們的社會講究什么?講究規(guī)矩,例如播音員要字正腔圓,寫文章要條理清晰,邏輯分明?,F在發(fā)現不是了,你普通話越不標準,得,觀眾還越喜歡;你文章沒人看得懂,得,無數少男少女為之瘋狂。這意味著社會舊有的運行秩序會被重構,背后所反映的是樣本分析、群體分析的難度在加大。任何一個偶發(fā)性的東西都會因為這些群體行為的不可測而變得難以捉摸,例如有段時間很流行的“賈君鵬,你媽媽喊你回家吃飯”“元芳,你怎么看?”都莫名其妙地流行起來,呈現無目的性,無意識的偶然性因素極大增加。你去豆瓣看,有個“打死不穿秋褲組”,幾十萬粉絲,還有個群“打死也要穿秋褲組”,也幾十萬粉絲,就是這個特征。由此判斷,未來的社會形態(tài)將呈現出“現代社會的部落制形態(tài)”,過去那種集中式、大一統(tǒng)的社會可能會進一步走向多元、分散,甚至去中心化,但由此帶來的是整個社會更易陷入小團體有意識,整體無意識的社會方向,從而使得社會的前進方向更具隨機性。于是也更容易理解,為什么現在互聯網上吵架那么多?互聯網的這種特性,極大地降低了吵架的成本,讓傻瓜碰到傻瓜的機會大大增加。以前找個人吵架也挺難的,現在容易多了,隨便放個屁都能臭到人家,不吵架也難。并且,在沒有足夠人群支持的情況下,吵架其實是需要膽子的,而一旦有一群相同觀點的人支持你的時候,人的膽子會增加,吵架因為有了看客而更容易引發(fā)。未來社會的另一個特征,是不可測事件的頻發(fā)性。我在前面提過一個觀點,到底是誰推動了社會的進步?社會由三種人構成:天才、腦殘、普通民眾。大部分人是普通民眾,天才和腦殘都是極少數人。以前我們接受的教育是人民群眾推動歷史前進,現在我不這么看,我感覺社會要么是精英推動,要么是腦殘推動,但是肯定不是普通人推動。為什么這么說呢?因為我們發(fā)現,人類社會進化的過程其實就是一個不斷搞死別的物種的過程,而這個過程中,基因突變很重要?;蛲蛔兪窃谶M化過程中能打敗別人和取得絕對優(yōu)勢的至關重要的一個環(huán)節(jié)。突變之后的個體展現出了更高層次的技能,從而給群體創(chuàng)造了一個進化的方向,并且?guī)ьI群體開啟這個進化過程。這個突變,本身就反映了隨機性和不確定性。發(fā)生突變的個體,從人類社會來說,就是精英或者腦殘。所以,我一直不認為我們走到今天這一步是必然的。在另外一個空間,可能并不是人主宰地球。這里面再深入下去,我們還會發(fā)現很有意思的事情。人類的進化并不是按照最優(yōu)路徑進行的,從進化通道來看,基因本身也會同時出現多種方向,并不是最先進的基因決定了進化方向。進化的方向往往帶有極大的偶然性,隨著外界環(huán)境的變化而變化,但外界環(huán)境又帶有極大的不確定性,大量的事情是非必然的。最好的例子是恐龍。恐龍的滅亡,很大程度是因為小行星的碰撞,這個突發(fā)的偶然性事件,使得統(tǒng)治了地球近1.4億年的恐龍在很短的時期里全部死去,代表了當時最先進生產力的恐龍就此滅亡,地球的進化方向轉向了。沒有任何數據可以推導出這個偶發(fā)性的外部因素,以及由此所造成的影響。人類進化歷程也必然如此,前進是必然的,如何前進卻是偶然的。由于樣本分布太少,數據不夠充分,那些推動人類歷史進程的天才或腦殘,現實中恰是無法進行數據推演的。簡而言之,正確歸納和推演社會普遍群體的某一邏輯,其背后需要穩(wěn)定的社會環(huán)境基礎,而穩(wěn)定的社會環(huán)境基礎,卻往往會被少數腦殘或者天才所改變。因此,結論是社會群體的推演其實是無法預測的,而且移動互聯時代更加劇了進程的不確定性。現在這種不確定性日益明確,我們反倒認為大數據的基礎其實在坍塌。我們繼續(xù)看大數據存在的一些假設前提條件,其中有一個認為互聯網世界提供了全數據。《大數據》這本書的聯合作者,牛津大學互聯網中心的維克托邁爾-舍恩伯格教授,曾說他最喜歡的對于大數據集合的定義是“N=所有”,這里不再需要采樣,因為我們有整個人群的數據。這就好比選舉監(jiān)察人不會找?guī)讖堄写硇缘倪x票來估計選舉的結果,他們會記點每一張選票。當“N=所有”的時候,確實不再有采樣偏差的問題,因為采樣已經包含了所有人。這個說法很有意思,因為互聯網的海量容納數據的可能性,的確給了全數據一個很好的假設前提,但是假設始終只是假設,現實卻總是現實。這個假設論證大數據意義的同時,也提出了一個致命的問題,即“N=所有”可實現么?如果N不等于所有,是否也意味著大數據其實是不可能實現的任務,這就是我在很多地方一直強調的全數據的可實現性。如果無法實現和提供全數據,那就意味著大數據可能是失效的,在下文互聯網人格章節(jié)里,我提過一個概念,如何看待民意的問題。理論上很多人都把微博作為輿論情緒的主要調查樣本,因為這里的數據第一可得,第二可統(tǒng)計,但是事實上,微博上的輿論情緒代表了真正的民意么?顯然不是的。很多時候我說,打開微博,暗無天日,關掉微博,風輕云淡。發(fā)現世界壓根沒有微博上說的那么糟糕,理由很簡單,微博的使用群體并不能代表社會的普遍性群體,中國十三億人,有十二億人壓根沒有使用微博的習慣,他們的情緒被忽視了。一個忽略了絕大部分群體的數據,能代表最終的輿論傾向么?基礎數據的樣本偏差,直接帶來了結果偏差,無法覆蓋足夠多的樣本所帶來的最終統(tǒng)計結果,其準確性必然是極差的。前面我提過大數據的本質必然是統(tǒng)計學的社會應用,它沒有帶來新的真理,沒有改變統(tǒng)計學的基礎原理,因此沒有必要刻意拔高它的現實意義。過去統(tǒng)計學中碰到的所有問題,大數據依然會碰到?,F在很多關于大數據的言論,其實都帶有一點文字游戲的特征,已經帶有很強的心理暗示和商業(yè)營銷行為在內。最經典的案例是少女懷孕那個案例,曾經非常的有名,但是卻經不起推敲。美國折扣連鎖店Target的傳奇式成功(由《紐約時報》的CharlesDuhigg于2012年報道),以后估計都難以效法。Duhigg解釋了Target公司是如何從它的顧客身上搜集到大量的數據并熟練加以分析,它對顧客的理解簡直到了出神入化的程度。Duhigg講的最多的故事是這樣的:一名男子怒氣沖沖地來到明尼蘇達州的某一Target連鎖店,向店長投訴該公司給他十幾歲的女兒郵寄嬰兒服裝和孕婦服裝的優(yōu)惠券。店長大方地向他道了歉??刹痪煤螅觊L又收到這名男子的電話,要求店長再次道歉——只是這一次店長告知那名男子,那個少女確實懷孕了。在這名男子還沒有意識到的時候,Target通過分析少女購買無味濕紙巾和補鎂藥品的記錄就猜到了這個事實。做這樣的案例分析之前,我們從統(tǒng)計學角度出發(fā),首先要考慮的問題是,這樣的案例背后我們所沒看到的其他因素,最簡單的一個因素就是,到底有多少沒有懷孕的人也收到了類似的優(yōu)惠券?這個很重要,直接關系到統(tǒng)計準確率的問題。事實上,這個少女可能僅僅只是個特例,因為很多跟她一樣的女孩子,其實都收到了優(yōu)惠券,因為Target給所有人都寄了,只是恰巧碰到了少女懷孕這個案例。兩者一比較,就會發(fā)現,大數據的光環(huán)沒了,在看大數據成功案例之前,其實我們要更多關注反面案例到底有多少,而不是正面案例有多少,一千萬碰到一個的算法跟精準命中的算法,雖然最終都是命中,但是商業(yè)價值是大打折扣的。大數據能解答風控命題么一、兩類金融風控模式具體到金融領域,金融在很大程度上是看天吃飯的。在過去幾百年歷史里,系統(tǒng)性風險的發(fā)生頻率很高,黑天鵝事件層出不窮。幾乎每8-10年就會來一次所謂的經濟危機,只是危機或大或小而已。而且每次構成經濟衰退的原因都不一而足,也無法預測。而每次經濟危機都會帶來金融機構的崩盤,逆勢而上幾乎不可見,也就說明了在天氣不好的情況下,你的風控技術再牛,其實都無法對抗這種系統(tǒng)性風險。很多人說,不是還有金融機構活下來了么?這就是風控技術的勝利啊。要回答這個問題,我們先對金融機構做個簡單的區(qū)分。金融機構就本質而言,我習慣分為兩種,一種是銀行業(yè)金融機構,另外一種是非銀行金融機構。兩者區(qū)別是什么呢?銀行業(yè)金融機構其實本質是存貸的中間主體,它是唯一可以向公眾吸收儲蓄的金融機構。利用吸收的儲蓄,可以進行貸款投放,銀行承擔了所有儲蓄存款客戶的風險,然后賺取貸款投放的中間利差。理論上,一旦收不回來的錢,超過了利差收入形成的利潤以及資本金,它就破產了。但是這種商業(yè)模式的優(yōu)點在于,可以合法利用資金池,不斷地借新還舊。只要保證足夠的流動性,信用品牌不出現問題,就能繼續(xù)吸收儲蓄。哪怕壞賬再高,超越了資本金,都還能不斷地玩下去。世紀之初,中國的商業(yè)銀行曾出現過類似技術性破產的局面。當時,由于有國家信譽背書,儲蓄一直在繼續(xù),這個游戲就能玩下去。而且隨著時間的推移,經濟的增長,也能不斷地消化風險。事實上,這種金融機構的本質是用制度來對抗各種風險,包括任何人都無法對抗的系統(tǒng)性風險。支撐銀行模式走下去的核心就是制度性安排。另外一類是非銀行金融機構,如投資銀行、信托公司、證券公司等等。非銀行金融機構都是無法吸收公眾存款的,也就無法通過吸儲來進行資金池運作。它們的盈利模式很簡單,一種是代理,一種是自營。代理業(yè)務本身不承擔風險,賺取的是無風險的服務費。由于這類金融機構的本質是幫助風險定價的證券化模式,機構可以自己持有一定額度的風險頭寸,即自營業(yè)務。事實上,如果業(yè)務操作得當,這部分的盈利會遠超代理業(yè)務的收入。像次貸危機之前,大量投行都樂于持有大規(guī)模的次級債,從而形成賬面大額盈利。但是由于持有了頭寸,必然意味著也要承擔風險,而一旦風險來臨,這些頭寸就會成為你的噩夢。從銀行類金融機構和非銀行金融機構的兩種業(yè)務模式來看,事實上,過去市場的風控一般也就是這兩種模式。一種是以銀行為代表的信貸化模式。它的本質是通過制度安排,利用中介機構的規(guī)模優(yōu)勢和期限錯配,讓風險在經濟運行的長周期中被化解。這種制度安排其實是銀行能活下來的根本原因。總體而言,當銀行達到一定規(guī)模后,個人能力在銀行體系內不再起主導作用,會不斷分化和瓦解。也只有如此,銀行才能穩(wěn)定地發(fā)展到一定規(guī)模,凡是依賴個人能力的商業(yè)模式都是無法持續(xù)擴張的。另一種就是證券化模式。證券化的本質是讓核心風險在市場中尋求自我定價和平衡,最終讓風險在不同的市場主體之間轉移。證券化不是承擔風險,而是讓風險通過市場得到合理的配置。采用證券化模式的機構最終比拼的是風險定價能力,而并非承擔風險的能力。這兩種模式各有利弊。我國是典型的信貸化主導的國家,信貸規(guī)模全球第一。這種間接融資占主導性地位的優(yōu)點,是政府在經濟活動中具備極強的控制力,而且在有效計算信貸總量的情況下,也可以有效防止發(fā)生系統(tǒng)性風險。缺點是因為無法通過證券化來分解和分攤風險,有可能會被倒逼產生極大的系統(tǒng)性風險。總體歸納,信貸化模式是總量可測下的風險不確定性。證券化的優(yōu)點,是讓風險在自我承擔和自我定價中不斷分解和暴露。但由于證券化是個風險流動的過程,會因為各種原因導致風險在市場中出現總量不可測量的情況。如果市場堆積了太多的風險,而又無法進行測定,一方面會加劇投機成分,一方面則會形成比信貸化模式更可怕的風險。因為每個主體都可能承擔了超越自我承受能力的風險,最終形成的風險會更高。我們回到中國的國情來看下這個情況,事實上,我們很有意思的點在于,中國雖然名義上,有信貸機構,也有非信貸機構,我們在2012年年底大面積放開資產管理,開啟大資管模式,無數人,包括我當初也都在歡呼雀躍,都認為資產管理元年開始,必將大面積削減銀行主導的金融格局,但是兩年多過去了,我們發(fā)現所謂的大資管,其實只是個接盤俠,而并非真正意義的進行所謂的證券化模式的核心就是讓風險在市場中尋求合理定價,發(fā)現都不是,我們有那么多的資產管理模式,但是都是名義上的證券化,他們的實質其實都是信貸模式,為什么?因為他們都必須剛性兌付,所謂剛性兌付,就是如同銀行一般,每個投資人都到最后必須拿回本金及利息,那也就是出現即使出現了風險,那必然到最后都是機構買單,這個時候,他們的盈利莫其實跟銀行的邏輯是一樣的,所以我們看到很有意思地方是,我們2012年的大資管,做的業(yè)務都是跟銀行一樣的,也就是純粹是放貸款的殼罷了,以證券化的機構從事信貸業(yè)務,問題就出現了。他們并沒有獲得銀行信貸機構的特許經營權,所以都只能變相的建設資金池,而資金池的成本卻極高,導致現在我們看到的大面積的資管風險的出現,一場擊鼓傳花的游戲可能無法維系,這個時候打破剛性兌付其實成為了不得不為之的事情了。因為誰也無法兜底。傳聞,銀監(jiān)會曾經對其所管轄的信托公司有過要求說,必須剛性兌付,公司兌付不了,股東兌付,股東兌付不了,換股東兌付,徹底的背離了資產管理公司所本身該承擔的定義。所以,我有段時間說目前我國銀行的信貸模式占比高達90%,被許多專家攻擊說不懂數據,缺乏支撐,事實上,我到是想說,是因為他們壓根不接地氣,我們目前的信托的主業(yè)大部分都是銀行通道業(yè)務,我們的基金子公司都是信托接盤,回到最后也是銀行信貸業(yè)務表外話的通道,其他就不用說了,這些能算是證券業(yè)務?風險凡是不能自擔的,其實一律都是信貸業(yè)務,那么最終使得我們的所謂資產管理,到最后都成為了銀行的小妾,銀行讓他們干什么就干什么,市場上最終比拼的壓根不是風險定價能力,而是誰的資源更好,渠道更佳,關系更好。能力壓根在過去的十多年來,根本不重要。這個也是為什么我們的資產管理,財富管理一直起不來的核心,核心還是資產風險定價的能力被制度性給破壞,銀行的優(yōu)勢一覽無余,無人可企及,只有在銀行都無法兜住的時候,才可能出現零星違約的事件,但是問題就來了,當銀行都兜不住的時候,誰又能兜住呢?所以我們目前看到的大量的本該是證券化機構,包括了P2P模式,這類公司最大的問題,就是跟銀行從事一樣的信貸工作,卻未能享受銀行一樣的制度性保護,所以,很多P2P拿自己跟銀行比較,其實是扯淡的事情,你是銀行么?銀行壞賬率可以高達40%都不破產,你可以么?不把這個問題想想明白,還是離開P2P比較好。銀行和非銀行都在同樣的信貸工作中一致競爭的時候,那就要想明白自己的核心優(yōu)勢是什么?拿什么跟銀行去打。順帶,在談談政府的牌照制度的弊病,我們最近很多資產管理機構出了事情,大量的小貸、擔保、甚至信托出了問題,回到最后其實是要反思牌照制模式,因為從正常意義上看,除了銀行這張無敵牌照外,其他牌照都是無法給機構增加風控能力的,并不是你政府給了牌照,這些所謂的資產管理機構,擔保、小貸等等,就具備風控能力了,你不給牌照就不具備能力,這壓根就是扯淡的事情,所以有次我在演講的時候,有個臺下擔保公司的老總站起來非常憤怒的指責我認為擔保基本快被P2P搞死的觀點的時候說,一派胡言,我們都是經過政府部門審批發(fā)放牌照的正規(guī)金融機構。我當時,回應說,對不起,真的,把你搞死的看上去是P2P,其實就這種好像很高大上,很牛逼,但是對你毫無幫助的政府牌照,這種牌照,對你有意義?是讓你團隊因為有了牌照就立刻牛逼了?那不是扯淡么。牌照,其實只會讓沒有風控能力的機構具備政府信用,從而引發(fā)的社會問題只會更大。我們只要看看現在大量擔保小貸跑路,政府卻會被圍攻的情況就可以知道為什么了?為什么啊,不正是因為你政府發(fā)放了牌照么?而且一年還一審批,領導沒事還常視察,這種審批和視察了之后,有用么?不照樣,該跑路的跑路,該倒閉的倒閉么?與此對比的是,反觀我們P2P出了事情以后,因為政府不附加信用,反倒問題相對簡單,去圍攻政府的幾乎沒有,圍攻了政府也好說話,關我屁事。你們愛投資投資,要死自己死去。從這個角度看,我們其實是政府要遠離大量他幫不上忙的信貸金融機構,既然幫不上忙,就離開他遠點,讓社會自己去解決,去用腳投票,優(yōu)勝劣汰之后,誰都會被教育出來的,但是政府一旦附加了信用,你就必須保證他不出事,就必須要附加政府信用,這個其實本身就是不公平的事情,反映的其實是政府信用的泛濫,憑啥你給他發(fā),不給我發(fā),憑啥你去他那里,不去我那里,而且為了獲得政府去視察的機會,一個個包裝門面的高大上,數據一個個開始造假,這種事情越演越烈。其實,對于非銀行信貸機構,最終是要跟證券市場一樣,政府應該遠離牌照審批的同時,不斷加強風險提示,從而培養(yǎng)出一幫寧愿自己跳樓,也不找政府麻煩的人,不斷培育和加強市場的違約機制,才可能是我們金融市場的未來,從這個角度我還是認同,證券化改革是未來的金融改革方向這個命題的。其實,這個問題后面還會再提。這里先扯淡到這里。二、風控技術的無用性前面說了,風控更多還是制度性安排,單一的風控技術其實往往是無效的,尤其是在市場同質化極為嚴重和飽和的情況下,更是無效,這里其實有個深層次的解答,是因為金融很大程度是維持社會穩(wěn)定的一種工具應用,從跟原來看,信用過度的情況下,金融往往是零和博弈的游戲,整體金融的盈利一般被封頂在社會經濟發(fā)展的上限制,超越這個值的很多都是自己跟自己玩的游戲,所以金融機構從短期和長期平均看,或者從整體和局部長期看,其實都是相對均衡的,往往都是社會平均理論值。撇開這個角度,我們從微觀來看,由于在同一市場里,大家最終的目標群體都是那些優(yōu)秀的具備還款能力的人,因為最終都是通過收益覆蓋,而這類人其實本身就是社會的少數,確切說是極少數,因此所有的金融機構的本質都是需要一種良好的技術能把他篩選出來。而事實上,銀行在面臨同業(yè)競爭的情況下,發(fā)現好的風控往往意味著沒有業(yè)務可以做。因為你堅持嚴格風控,人家就不跟你玩了,全球都一樣。很多人都跟我說我們的風控極端牛逼,第一我是不相信,第二即使相信了,我說,那就等死吧,誰來跟你玩啊,你要抵押,人家就不要抵押,你要擔保,人家就不要擔保,市場是競爭的,博弈的,誰都不是傻瓜,你以為你想怎么玩就怎么玩?還真想著業(yè)務隨便你挑呢。也太把自己當一回事了。我們現在發(fā)現很多銀行信貸機構都被套牢了,你以為人家風控能力差,不知道客戶的真實情況?可能么?現實情況是,銀行的風控面對業(yè)務壓力的時候,大部分都只能選擇妥協,尤其是客戶經理,當前跟未來之間,做什么選擇?肯定選當下,不然立馬被掃地出門,所以客戶經理每天想業(yè)務的同時,都想著如何繞彎子過風控?有時候想想,都是自己騙自己的游戲罷了。怪誰?不知道。只是覺得,每年要求銀行40%的利潤增長之下,談風控本身就是很可恥的事情。其實,現在的市場更有意思,今年二季度信貸規(guī)模數據下降,很多人很奇怪,有啥好奇怪的,今年這種情況,往往牛逼的人,都不來貸款了,為什么,因為貸款來的錢,賺不了錢,那貸款干什么呢?白白給銀行付利息,市場形勢不好的情況下,他們不愿意擴張,自然就不來貸款,而這么差的行情還來貸款的人,基本上都是垃圾,要么就是之前流動性出現困境,就是想渾水摸魚,就是這么個事情,整體經濟下行的時候,談風控更是扯淡的事情了。毫無意義。2002年次級債在美國興起的時候,很多銀行都認為風險極高,堅持抵制。但是隨著該業(yè)務越做越大,盈利越來越高,你如果堅持抵制,就必然會喪失極大的市場,逼迫一些銀行開始涉水進行該項業(yè)務操作,這就是劣幣驅逐良幣的結果,好人往往都是被壞人逼死的,或者淪落為壞人,很正常。這幾年很多人都開始指責銀行的風控怎么那么差,明顯的騙子都防范不了,事實上,我們再來比較銀行過去五六年,發(fā)現五六年前的銀行和現在的銀行,在風控層面上無論技術還是人員結構都沒有什么太大的變化,但是實質的壞賬率卻是十倍之差,難道是因為風控技術變化了么?都不是,實質是天氣發(fā)生了變化,大環(huán)境在變化,導致你微觀層面無論如何怎么動作都是無效的。過去幾年我在一個民間高利貸班上課,我經常讓他們這幾年如果沒事就跟著我出去游山玩水,騙吃騙喝算了,回頭看看,跟著我到處游走的人,這幾年至少都還活著,而那些窩在家里勤勤懇懇努力放貸款的人,基本上都趴下了,為什么呢?跟技術毫無關系,你敢說在家勤懇放貸款的人一定比游山玩水的人要水平低?可能么,怎么可能,但是往往世界上有很多人很悲催的地方就在于在不該努力的時候太努力了。過去十多年來看,往往發(fā)現一個真理是什么呢?是趨勢比能力重要的太多,太多。我們很多技術大牛在00年的時候進了一家當時巨牛逼的技術公司,那家公司叫UT斯達康,而能力不行,而被拋棄的人去了當時一家名不見經傳的小公司,叫阿里巴巴,十年后發(fā)現世界被顛覆了,ut基本死了,所以那些技術大牛都悲催了。而那些萬般無奈去了阿里的人,現在身價都是當技術大牛無法企及的了?這種案例不可勝數,94年國企改革,大量下崗的人,轉行經商,暴富,而那些沒下崗的人都一個個現在開始下崗了。其實,能力越強,反倒越容易被趨勢給擊垮,這個是實情。我們很多人在02年出國讀書,留在國外,其實恰恰錯過的是中國發(fā)展最快的十年,雖然不能單物質來進行論述成敗得失,但是錯過的十年的確如此。這個世界我們大多數人總是無意識的在做一件跟趨勢對抗或者順應的事情,但是我們還是希望能多抬抬頭看看,有意識的希望看的更遠點,我們的歷史如同一條大河,奔騰而去,大氣磅礴,我們如同河流里一條魚,大部分的魚都是隨波逐流,而總有個別的魚希望跳起來看看未來,希望能看的更遠,但是,大部分的魚都只看到了自己看到的方向,最終誰都無法得知正確與否,于是結果論是最好的論調了。我對自己說的總是跳起來看,對不對壓根不重要,重要的是我跳起來了,看到了更多的風景,哪怕錯了也無值得,思考是自由的最好表現,不思考給了自由和民主,也都毫無意義。貌似有點跑題了,我只是想表達,金融這個東西吧,就是能賺錢的時候,狠狠的賺錢,不會因為你發(fā)放貸款12%就一定比36%的安全,本質都是一樣的,都不會出問題,而市場無法賺錢的時候,你其實怎么做都是錯的,這跟風控技術關系都不是很大,金融是個極順應經濟周期的行業(yè),所以作為個體而言,金融有做和不做的選擇。而無技術高低的區(qū)別,個別人或許有,極端牛逼或者極端傻逼,絕大部分其實是差不多的。而作為金融機構而言,金融業(yè)的競爭不是單一技術的競爭,而是綜合性競爭,某一個維度的優(yōu)勢不太可能成為持續(xù)性優(yōu)勢。我們看幾百年的金融行業(yè)競爭格局,一時的勝利容易,持續(xù)的勝利挺難,不斷超越的背后其實是幾代人的努力。很多盛極一時的金融機構,都消失在歷史粉塵之中。三、大數據風控無效的N個理由全球到目前為止,其實也就是這兩種風險承擔模式,除此之外,沒有一個機構或者一項技術可以說它能解決風控問題?,F在很多人在扯大數據的風控,事實上都是一廂情愿,不現實也不可能。大數據可以優(yōu)化管理、提高風控效率、降低風控成本,但是無法決定風控質量,銀行的風控質量永遠是個一攬子系統(tǒng)工程。不同銀行面對同一風險等級的客戶,它們的風控往往不是同一個水平。因為不同的銀行有不同的風險承受能力,自然會形成不同的風險定價,存在差異性。所以我曾說,很多P2P公司提出來的征信系統(tǒng)接口如何開放的問題,其實是無法解答風控命題的。不是說征信系統(tǒng)開放了,你風控就OK了,這是不可能的。因為全行業(yè)都面對同一個征信系統(tǒng),最終的使用效率、定價能力,還是取決于你自己的能力。越是公開透明的市場,其實競爭的難度越大,單純開放征信系統(tǒng)不能解決你們的風控問題。仔細分析下為什么大數據無效,我的理由是多方面的。第一個理由就是,金融其實是看天吃飯的。我一直堅持金融是被經濟形勢所決定的,在經濟形勢低迷的情況下,金融機構無論怎么折騰都很難玩出特別好的花樣。2008年金融危機一來,覆巢之下安有完卵,就是這么簡單的道理。系統(tǒng)性風險是任何一家金融機構都必須面臨的現實問題,風控制度在系統(tǒng)性風險面前,毫無意義。那么,大數據能否預測經濟形勢,即預測系統(tǒng)性風險呢?很多人說大數據可以做到,我覺得都是扯淡。前面已經論述了“過去是無法有效推演未來”的邏輯。那么就個人而言,是否有通過數據分析形成準確判斷的可能性?這個很難說,有人一葉而知秋,有人一葉而障目,都是個人能力的結果。個人能力很難說是一種模式的核心競爭力,也缺乏可持續(xù)性。第二個理由是,金融行業(yè)其實不完全符合大數據所要求的邏輯前提。大數據的核心邏輯前提是統(tǒng)計學,有兩個要素:一是樣本篩選,就是通過數據篩選出相同特征的群體出現違約的概率;二是需要足夠數量來覆蓋統(tǒng)計學里的偶發(fā)性特征。兩者是統(tǒng)一而不可分割的。因為大數據的相關性必然是建立在足夠大樣本量基礎上的,僅僅是個體相關不足以成為推斷相關性的基礎。也就是說,在金融業(yè)務操作的時候,也必須覆蓋足夠大的人群,但足夠大是多少?對于單一金融機構而言,“足夠大”已經是個絕對致命的難題了。另外,這里其實還隱含一個基礎邏輯,就是每個操作的業(yè)務群體還要呈現獨立非相關,否則也沒啥意義。這里我們做個小討論:經營性貸款和消費性貸款,哪個更可能做大數據風控?我認為是消費信貸。為什么呢?因為從人群的需求特征來看,消費性需求更穩(wěn)定,雖然也會受經濟波動的影響,但跟經營性需求相比還是更穩(wěn)定,更容易預測。而且從人群來看,消費性需求的覆蓋面也更廣泛,有更扎實的數據基礎。相對而言,經營性需求就很難使用數據來進行模型化了。為什么呢?先從企業(yè)主來看。什么人會成為企業(yè)主?事實上,只要成為企業(yè)主,無論是大是小,他們都自動從普通人群里獨立出來了。再小的企業(yè)主,其實都是社會的另類,成功的是精英,失敗的是腦殘,唯一不可能的就是社會公眾。所以這類人本身就是異類,個個都充滿極大的不確定性和變數,很難被量化和模型化。這里還有一個問題,相同的人群在不同場合呈現的特征是不一樣的,尤其是目前人們在線上、線下割裂的狀態(tài),其行為方式往往會出現強烈的反差。因此,對于同一個人,根據單一維度數據對其進行判斷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論