簡單統(tǒng)計學(中文版)_第1頁
簡單統(tǒng)計學(中文版)_第2頁
簡單統(tǒng)計學(中文版)_第3頁
簡單統(tǒng)計學(中文版)_第4頁
簡單統(tǒng)計學(中文版)_第5頁
已閱讀5頁,還剩230頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

取脅

目錄

第1章模式、模式、模式

混雜效應

選擇性報告與謊報

易受欺騙的本性

無論文,不生存

統(tǒng)計顯著性膜拜

第2章不再神奇的超級暢銷書

去最好的學校

投票人數(shù)越多越好?

一醉方休

放下遙控器

請原諒我的直白

只有弱者留下來

被損壞的飛機

暢銷書的秘密

第3章被誤傳的謀殺之都

馬薩諸塞州謀殺之都

請在我家后院開一座采石場

第4章新的經(jīng)濟學上帝

政府債務臨界點

相關(guān)性等同于因果關(guān)系?

墮胎會減少犯罪嗎?

是我的錯

第5章?lián)P基隊的門票真的劃算嗎?

我的天哪

虛驚一場

讓他們吃蛋糕吧

有彈性的數(shù)軸

將惡作劇翻倍

學生謊言

揚基隊的門票很劃算

圖像的制作藝術(shù)

第6章美國有多少非裔職業(yè)運動員?

蒙提?霍爾問題

一個名叫佛羅里達的女孩兒

條件概率的混淆

假陽性問題

罕見病問題

達特茅斯三文魚研究

第7章辛普森悖論

某人的悖論

我要再來一杯咖啡

第8章狀態(tài)火熱的雷?阿倫

小數(shù)定律

一項籃球研究

小沃爾特?雷?威廉姆斯

投擲馬蹄鐵

保齡球

第9章勝者的詛咒

均值回歸

西克里斯特的愚蠢

古老的謬誤何曾消亡?

道指落榜生

冠軍窒息

尋找學院院長和靈魂伴侶

第10章如何轉(zhuǎn)變運氣?

第11章德克薩斯神槍手

癌癥聚集恐慌

第12章終極拖延

死亡凹陷和尖峰

經(jīng)過進一步研究

午夜的月餅

漫長的告別

第13章黑色星期一

火箭科學

巴斯克維爾獵犬

五行噩運

花押決定論

第14章點球成金

棒球迷信

如果你給我一個D,我就會死(die)

糟糕的出生月份

名人堂的死亡之吻

第15章特異功能真的存在嗎?

超感知覺

霍迪尼的挑戰(zhàn)

一個家庭對超自然現(xiàn)象的著迷

第16章彩票是一種智商稅

目之所及

我們都將為IBM工作

股票是一種不錯的投資

跑贏大盤(或者說為什么我喜?愛包裝工隊)

傻瓜四股

反向頭肩

如何(不)中彩票

不會破裂的泡沫

南海泡沫

伯克希爾泡沫

真實股價

第17章超級投資者

寬客

收斂交易

我只看數(shù)據(jù)

在推土機面前撿硬幣

閃電崩盤

第18章增長的極限

窮途末路

第19章何時相信,何時懷疑

被模式誘惑

具有誤導性的數(shù)據(jù)

變形的圖像

缺乏思考的計算

尋找混雜因素

手氣好

均值回歸

平均定律

德克薩斯神槍手

當心經(jīng)過修剪的數(shù)據(jù)

缺乏理論的數(shù)據(jù)僅僅是數(shù)據(jù)而已

缺乏數(shù)據(jù)的理論僅僅是理論而已

美好的出生日

第1章

模式、模式、模式

在我所生活的南加州,青少年對于足球的熱情很高。這是一項經(jīng)濟而有趣的運動,各

種身高和體型的男生和女生都可以參與其中。起初,我對足球一無所知。我只知道在每個

周末,城市里的公園和操場上都會有許多身穿鮮艷隊服的孩子追著足球跑來跑去,他們的

家長則會站在一旁為他們歡呼。當我的兒子長到合適的年齡時,我們也成了這些家長中的

一員。

2010年世界杯時,我的兒子在南加州一家頂級足球俱樂部踢球。我是這家俱樂部的

經(jīng)理,也是足球的狂熱愛好者,因此我們共同觀看了我們能夠看到的每一場世界杯比賽。

決賽是在荷蘭和西班牙之間進行的。這是兩支巨星云集的隊伍,但是它們所在的國家常常

無法取得很好的成績,這使它們的支持者非常失望。哪個國家最終能夠贏得世界杯?我喜

愛荷蘭隊,他們贏得了這屆世界杯之前的6場比賽,進了12個球,只丟了5個球,而且

淘汰了強大的巴西和烏拉圭。接著,我聽說了章魚保羅(Paul)的故事。人們將裝有食物、

貼有國旗的塑料盒子放在保羅面前,讓它進行選擇。通過這種方式,保羅正確預測出了7

場世界杯比賽的獲勝者。在決賽前,預言家保羅選擇了西班牙,因此全世界似乎都認為西

班牙將會成為勝利者。

到底發(fā)生了什么事情?一只黏糊糊的、缺乏智商的無脊椎動物怎么可能比我更加了解

足球呢?我感到好笑,等待著無所不知的保羅在全世界面前丟臉。我失算了。荷蘭隊沒有

表現(xiàn)出應有的創(chuàng)造性和才華。在一場粗暴而蹩腳的比賽中,裁判亮出了14張黃牌一一其

中9張給了骯臟的荷蘭人。憑借終場前4分鐘的進球,西班牙隊取得了勝利。

生活在水箱里的章魚怎么可能預見到這種事情呢?保羅看過足球比賽嗎?它有大腦嗎?

實際上,章魚是最聰明的無脊椎動物。不過,就像鍥子里拔出來的將軍一樣,這并不

能說明任何問題。盡管如此,保羅仍然進行了8次世界杯預測,而且無一失手。此外,保

羅還在2008年歐洲足球錦標賽期間進行了6次預測,成功了4次。加上2010年世界杯,

保羅一共進行了14次預測,成功了12次。在許多人看來,這足以從統(tǒng)計上證明保羅的

超自然能力。不過,這些數(shù)據(jù)真的足夠多嗎?

如果進行14次公平的拋硬幣實驗,得到12次或者12次以上正面的可能性只有不到

1%。同樣的道理,如果保羅僅僅是一個沒有特殊運氣的猜測者,每次正確預測的可能性

為50%,那么它多次預測成功的概率只有不到1%,這個概率非常低,足以被視作具有

“統(tǒng)計顯著性"。由于保羅多次預測成功的可能性如此之低,因此我們可以合理地排除運氣

的成分。保羅用一次又一次的成功證明了它不僅僅是一個幸運的猜測者。它的確是“具有

超能力的章魚保羅"!

不過,這件事似乎有些蹊蹺。章魚真的有可能預測未來嗎?保羅的表現(xiàn)可以引出統(tǒng)計

研究領(lǐng)域的一些常見問題。保羅不是超能力者(真是令人驚喜),而是一個應當引以為戒

的反面教材。當你下次聽到某種荒誕的說法時,你應當保持警惕。

混雜效應

首先,讓我們看一看保羅是如何進行預測的。在喂食的時候,人們會把兩只正面粘有

球隊國旗的透明塑料盒子擺放在保羅面前。盒子里面放著相同的美味食物,比如貽貝或者

牡蠣。保羅第一個打開的盒子就是它所預測的勝利者。

章魚并不十分了解足球,但它們擁有出色的視力和良好的記憶力。有一次,新英格蘭

水族館的一只章魚對一名志愿者產(chǎn)生了反感。每當它看到這名志愿者時.,它都會向她噴射

海水。后來,這名志愿者離開了水族館,上了一所大學。當她幾個月以后回來時,章魚仍

然記得她,并且立即用海水淋濕了她的衣服。西雅圖一家水族館做了一項實驗,一名志愿

者為章魚喂食,另一名穿著同樣衣服的志愿者用木棍挑逗章魚。一個星期以后,大多數(shù)章

魚都能將兩個人區(qū)分開。當它們看到“好人”時,它們會向他靠近;當它們看到“壞人"時,

它們會離開(有時還會向他噴射許多海水)。

"具有超能力的章魚保羅”生活在德國的一家水族館里。除了西班牙和荷蘭的世界杯決

賽,保羅只預測了德國隊參加的比賽。在德國參加的13場比賽中,保羅11次選擇了德

國一一而德國贏下了其中的9場比賽。保羅之所以選擇德國,是因為它對德國的對手進行

了詳細的分析,還是因為它喜歡德國國旗?保羅幾乎一定是色盲,不過實驗表明,章魚能

夠識別明暗度,而且喜歡橫向形狀。德國國旗有由三塊鮮艷的水平條紋組成,塞爾維亞和

西班牙的國旗也是如此,而保羅只選擇過這三個國家。實際上,西班牙和德國的國旗非常

相似,這也許可以解釋為什么保羅在西班牙和德國之間的兩次比賽中選了一次西班牙,并

在世界杯決賽中選擇了西班牙而不是荷蘭。保羅只有一次沒有選擇德國或西班牙國旗,那

是塞爾維亞和德國之間的一場比賽。

國旗顯然是一個混雜因素,因為保羅選擇的并不是最佳足球隊,而是它最喜歡的國旗。

說到底,"無所不知的保羅”只是一只缺乏智商的章魚而已。

圖1.1保羅最喜歡的國旗

選擇性報告與謊報

對于保羅的成功,另一種解釋是,許多人多次嘗試過這種愚蠢的寵物把戲,用寵物來

預測體育、彩票和股票領(lǐng)域的獲勝者。

在1000個拋硬幣的人之中,一定會有一些人連續(xù)拋出10次正面。同樣的道理,在

這些嘗試寵物把戲的人之中,一定會有一些人取得成功。你覺得誰會得到報道呢?是選中

獲勝者的章魚,還是無法做出成功預測的鴕鳥?

幾年前,《達拉斯晨報》的一位體育專欄作家度過了極為倒霉的一個星期,他在選擇

國家橄欖球聯(lián)盟(NFL)比賽的獲勝球隊時猜對了1次,猜錯了12次,還有一場比賽是

平局。他寫道:"理論上說,如果讓達拉斯動物園里的一只狒狒觀看14場NFL比賽的賽

程,讓它為每場比賽選擇一支球隊,它可以至少選出7支獲勝球隊。"第二個星期,拉達

斯動物園里的大猩猩“坎達大帝"(KandatheGreat)通過選擇訓練員手里的紙條進行了預

測。結(jié)果,坎達猜對了9次,猜錯了4次,擊敗了《達拉斯晨報》的所有6位體育專欄作

家。媒體像發(fā)現(xiàn)食物的餓狼一樣爭相報道這個故事。不過,如果坎達的表現(xiàn)沒有這么好,

比如猜對6次,猜錯7次,它還會被人報道嗎?

明尼蘇達州蘋果谷市明尼蘇達動物園的官員也不甘示弱,他們表示,一只叫做明迪

(Mindy)的海豚成功預測出了NFL比賽的結(jié)果。他們制作了一些樹脂玻璃片,每個玻璃

片上寫有不同球隊的名稱。他們將每場比賽對應的兩塊樹脂玻璃片扔到明迪的游泳池里,

被明迪交還給訓練員的那塊玻璃片被視作它的“預測”。訓練員表示,明迪在53場比賽中

猜對了32場。根據(jù)這種說法,明迪的成功率為60%,這足以幫助人們借此贏得橄欖球比

賽的賭博而獲利。

有多少鳥兒、蜜蜂和野獸曾經(jīng)嘗試預測NFL比賽、并且由于預測失敗而沒有得到報

道呢?我們并不知道這一點,而這正是問題的關(guān)鍵。如果數(shù)百只寵物曾經(jīng)被迫進行毫無意

義的預測,而且我們只知道其中得到報道的成功寵物,沒有考慮到數(shù)百只沒有得到報道的

失敗寵物,我們就會產(chǎn)生錯誤的想法。

這個問題不限于橄欖球領(lǐng)域。明尼阿波利斯的一名股票經(jīng)紀人曾經(jīng)吹噓說,當他選擇

股票時,他會把《華爾街日報》鋪在地板上,讓它的金毛尋回犬把右前爪放在報紙上,然

后選擇它的第一個指甲碰到的股票。他認為這種說法可以吸引投資者的關(guān)注,這一事實說

明他本人可能是有問題的一一他的顧客可能也有問題。

另一個因素是,為了出風頭,人們可能會捏造數(shù)據(jù),以吸引公眾的注意。明尼阿波利

斯那個股票經(jīng)紀人和他的狗每天早上都會得到公正的監(jiān)督嗎?過去,橋牌曾經(jīng)是美國最流

行的撲克游戲,當時有許多人向當?shù)貓蠹埍硎荆麄兂榈搅送换ㄉ氖龔埮啤R晃幌?/p>

歡數(shù)學的橋牌選手通過估計發(fā)現(xiàn),出現(xiàn)這種情況的數(shù)量太過離譜。考慮到抽到這種牌的可

能性,當時進行過的總局數(shù)遠遠不足以產(chǎn)生如此眾多的“同花色局"。值得注意的是,報紙

報道的這種相同花色通常是黑桃。顯然,為了讓自己的名字出現(xiàn)在報紙上,人們對自己的

經(jīng)歷進行了潤色。

在章魚保羅獲得全世界的關(guān)注以后,新加坡一個之前默默無聞的算命先生表示,他的

助手、長尾小鸚鵡馬尼(Mani)正確預測出了世界杯四分之一決賽的所有四支獲勝球隊。

于是,馬尼獲得了全世界的關(guān)注。接著,它對后面的比賽進行了預測,認為在半決賽中烏

拉圭將擊敗荷蘭,西班牙將擊敗德國,在決賽中,西班牙將擊敗烏拉圭。在荷蘭戰(zhàn)勝烏拉

圭以后,馬尼改變了它對決賽的預測,選擇了荷蘭,這個結(jié)果當然又錯了。不過,前來拜

訪這位算命先生的顧客從每天10個人增加到了每小時10個人一一面對這個結(jié)果,你可

能會產(chǎn)生疑問:這位主人的動機真的僅僅是娛樂嗎?他最初提供的馬尼對四分之一決賽的

預測結(jié)果是真的嗎?

保羅和馬尼本應默默無聞,處于無人知曉的狀態(tài)。為什么它們會聲名鵲起、受到足球

愛好者的認真對待,甚至受到他們的贊美和詛咒?真正有問題的不是它們,而是我們自己。

易受欺騙的本性

一個多世紀以前,夏洛克?福爾摩斯(SherlockHolmes)向他飽受折磨的朋友華生

(Watson)懇求道:"數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!我不能在沒有黏土的情況下制造磚塊。”今天,

福爾摩斯的愿望已經(jīng)得到了滿足。強大的計算機可以對海量數(shù)據(jù)進行篩選。問題不再是我

們沒有足夠的數(shù)據(jù)?,而是我們眼前的數(shù)據(jù)對我們產(chǎn)生了誤導。這不完全是我們的錯。我們

可以將責任歸咎于我們的祖先。

某些性狀的演化原理比較簡單。如果生物的某些可遺傳特點能夠幫助它們生存和繁衍,

那么同那些在其他方面相似,但是沒有這些特點的個體相比,擁有這些特點的個體更容易

將它們傳給未來的后代。經(jīng)過一代又一代的傳遞,這些可遺傳的特點將成為群體的主流。

樺尺螳著名的演化歷程是一個簡單而直觀的例子。這種飛蛾大部分時間生活在樹上,

它們通常是淺色的,這種顏色可以幫助它們躲避鳥兒的捕食。1848年,英國發(fā)現(xiàn)了第一

只深色樺尺蟆。到了1895年,曼徹斯特98%的樺尺蟆都是深色的。到了20世紀50年

代,情況再次出現(xiàn)了逆轉(zhuǎn)。目前。深色飛蛾已經(jīng)很少見了,而且可能很快就會滅絕。

進化論的解釋是,深色飛蛾的出現(xiàn)與工業(yè)革命導致的污染相重合。煤灰和煙霧導致樹

木變黑,這使深色飛蛾獲得了優(yōu)勢,因為它們可以更好地偽裝自己,躲過捕食者的視線。

由于深色飛蛾存活下來并繁衍后代的可能性得到了提高,因此它們開始成為基因池的統(tǒng)治

者。后來,英國的空氣清潔法律扭轉(zhuǎn)了這一局面,因為淺色飛蛾可以更好地在沒有污染的

樹上偽裝自己。它們的生存優(yōu)勢使它們再次煥發(fā)了生機。

自然選擇的其他例子更加微妙。例如,許多研究發(fā)現(xiàn),男性和女性更喜歡具有對稱面

孔和身體的人。這不僅僅是一種文化因素一一它適用于不同的社會,適用于嬰兒,甚至適

用于其他動物。在一項實驗中,研究人員剪掉了一些雄性家燕的尾羽,使它們失去了對稱

性。其他雄性家燕則保留了對稱的尾羽。當他們在這個基因池中放開雌性家燕時,這些雌

性家燕選擇了帶有對稱羽毛的雄性家燕。這種對于對稱性的偏愛并不僅僅是一種膚淺的行

為。缺乏對稱性的潛在配偶顯然存在某種基因缺陷,可能影響它的力量、健康和生育力。

擁有對稱性偏好的個體最終將成為基因池的統(tǒng)治者,而缺乏這種偏好的個體擁有強壯、健

康和可育后代的可能性要低一些。

進化也是許多人對保羅和馬尼信以為真的原因,盡管你可能不相信這一點。我們對于

對稱性的內(nèi)在偏好,可以很好地說明我們的人類祖先是如何通過識別各種模式在這個殘酷

的世界上生存和繁衍的。烏云常常是降雨的前奏。灌木叢中的聲音可能是捕食者發(fā)出的。

毛發(fā)質(zhì)量是繁殖力的象征。一些遠古祖先可以通過模式識別更好地尋找食物和水源,發(fā)現(xiàn)

危險,對可育伴侶產(chǎn)生吸引力,他們將這種能力傳給了未來的后代。那些不太擅長模式識

別,因而不太容易生存和繁衍的個體將基因傳下來的可能性要小一些。通過無數(shù)代自然選

擇,我們形成了尋找模式并對其做出解釋的內(nèi)在傾向一一烏云會帶來降雨,捕食者會發(fā)出

聲音,繁殖力強的成年人擁有漂亮的毛發(fā)。

遺憾的是,這種適用于遠古祖先的模式識別技能并不能很好地適應我們的現(xiàn)代生活,

因為我們面對的數(shù)據(jù)非常復雜,不是很容易解釋。我們解釋眼前事物的內(nèi)在愿望導致了兩

種認知錯誤。首先,我們很容易被模式以及解釋模式的理論所引誘。其次,我們緊盯著支

持這種理論的數(shù)據(jù),忽視與之相矛盾的證據(jù)。我們相信這些故事,因為它們與我們觀察到

的模式相符。一旦我們接受了這些故事,我們就很難放棄它們了。

當你在雙骰賭桌上不斷搖出七點時?,你認為自己將繼續(xù)保持連勝勢頭,因為你希望如

此。當你不斷投出兩點時,你認為自己轉(zhuǎn)運的時候到了,因為你希望如此。我們并沒有認

真地考慮過,骰子既不會記憶過去,也不會關(guān)心未來。它們是沒有生命的;它們所具有的

意義完全是我們這些滿懷希望的人類賦予它們的。如果連勝勢頭持續(xù),或者連敗勢頭終止,

我們就會更加相信自己想象出來的理論是正確的。如果這種情況沒有出現(xiàn),我們就會制造

一些借口,以便堅持自己荒謬的信仰。

當運動員穿上沒有洗過的幸運襪子,當投資者購買熱門股票,當人們投入大筆資金購

買不良資產(chǎn)、相信它們一定會觸底反彈時,他們的行為和上面如出一轍。我們渴望使不確

定的世界變得更加確定,渴望控制我們無法控制的事物,渴望預測那些無法預測的現(xiàn)象。

如果我們穿著這種襪子取得了良好的表現(xiàn),那么這一定是襪子的功勞。如果其他人購買這

只股票賺了錢,那么我們購買這只股票也可以賺錢。如果我們運氣不好,那么我們一定會

轉(zhuǎn)運,不是嗎?秩序比混亂更加令人舒適。

由于這些認知錯誤,我們很容易受到各種統(tǒng)計性騙局的蒙蔽。當人們用毫無意義的模

式來證明政府政策的后果、營銷計劃的不凡影響、投資策略的成功或者保健品的效果時.,

我們很容易認為這些模式是有意義的。由于我們在內(nèi)心深處希望理解這個世界,因此我們

形成了這種聲名狼藉的、很難擺脫的弱點。

無論文,不生存

即使是受教育程度很高、應當具有冷靜頭腦的科學家也很容易受到模式的誘惑。在殘

酷的學術(shù)研究領(lǐng)域,聰明好勝的科學家一直在追求名譽和資助,以維持他們的事業(yè)。這種

必要的支持是由他們在同行評議期刊中發(fā)表的成果決定的。“無論文,不生存”是大學生活

中的一個殘酷現(xiàn)實。

有時,在巨大的壓力面前,研究人員甚至會撒謊和作弊,以實現(xiàn)個人的職業(yè)發(fā)展。為

了生存,他們需要得到能夠發(fā)表的結(jié)果,但他們的實驗結(jié)果并不符合預期,這使他們感到

沮喪;此外,他們還會擔心其他人搶先發(fā)表類似的結(jié)果。因此,這些研究人員有時會對實

驗數(shù)據(jù)做手腳。畢竟,如果你相信你的理論是正確的,那么編造出證明這種理論的數(shù)據(jù)又

有什么關(guān)系呢?

英國醫(yī)生安德魯?韋克菲爾德(AndrewWakefield)制造的疫苗恐慌就是這種欺騙的

一個嚴重案例。1998年,韋克菲爾德和其他人在久負盛名的英國醫(yī)學期刊《柳葉刀》上

發(fā)表了一篇論文,稱12名正常兒童在接種麻疹、腮腺炎和風疹(MMR)的疫苗以后患上

了自閉癥。實際上,在發(fā)表這篇論文之前,韋克菲爾德已經(jīng)在一場新聞發(fā)布會上公布了他

的研究成果,并且呼吁停止接種麻腮風三聯(lián)疫苗。

許多家長看到了這方面的新聞報道,對于之前的例行程序產(chǎn)生了疑慮。他們的孩子患

上自閉癥的可能性似乎比感染麻腮風的可能性更加令人擔憂;畢竟,后者在英國幾乎已經(jīng)

絕跡了。一百多萬名家長拒絕讓他們的孩子接種麻腮風疫苗。

雖然我住在美國,但我和我的妻子也讀到了這些新聞故事,并且產(chǎn)生了憂慮情緒。我

們在1998年、2000年和2003年生下了3個兒子,并在2006年生下了1個女兒,因此

我們需要決定是否為他們接種疫苗。我們進行了調(diào)研,同一些醫(yī)生進行了交談。所有醫(yī)生

都對韋克菲爾德的研究持懷疑態(tài)度。他們指出,沒有任何證據(jù)表明自閉癥正在變得更加流

行;我們之所以聽到更多的自閉癥案例,是因為自閉癥的定義近年來得到了拓寬,而且醫(yī)

生和家長對于自閉癥癥狀的意識有所提高。另一方面,麻疹、腮腺炎和風疹是極具傳染性

的疾病,它們之所以在許多國家得到了有效的清除,恰恰是因為這些國家推行了常規(guī)免疫

接種計劃。如果我們的孩子不接種疫苗,不僅他們會面臨危險,其他孩子也會陷入危險之

中。此外,這項研究樣本很小(只有12個孩子),而且作者似乎急于將其公之于眾,這

些都是很大的疑點。最終,我們決定為我們的孩子接種麻腮風疫苗。

不是只有我們遇到的醫(yī)生產(chǎn)生了懷疑。一些人試圖復制韋克菲爾德的結(jié)果,但他們并

沒有發(fā)現(xiàn)自閉癥和麻腮風疫苗之間的任何關(guān)系。更糟糕的是,倫敦《星期日泰晤士報》記

者布賴恩?迪爾(BrianDeer)在2004年進行了一項調(diào)查,在韋克菲爾德的研究中發(fā)現(xiàn)了

一些可疑的反常之處。韋克菲爾德的研究似乎得到了一些律師的資助,這些律師希望接到

針對醫(yī)生和制藥公司的利潤豐厚的人身傷害訴訟。更加令人吃驚的是,韋克菲爾德本人顯

然正在計劃推出一種替代性疫苗,他認為這種疫苗是安全的。韋克菲爾德的結(jié)論是否受到

了這些利益沖突的影響?

韋克菲爾德聲稱自己并沒有做出不道德的行為,但迪爾并沒有停止挖掘。他發(fā)現(xiàn)了一

些更加可惡的事情:韋克菲爾德論文中的數(shù)據(jù)與英國國民健康服務系統(tǒng)的官方醫(yī)療記錄不

符。在韋克菲爾德聲稱患上倒退型自閉癥的9名兒童中,只有一個人被明確診斷出了這種

疾病,還有3個人根本沒有患病。韋克菲爾德聲稱12個孩子在接種麻腮風疫苗之前“是正

常的“,但是其中5個人擁有發(fā)育問題的歷史記錄。

韋克菲爾德這篇論文的大多數(shù)共同作者很快撇清了自己與文章的關(guān)系。《柳葉刀》

2010年撤銷了這篇論文,并表示,"論文中的說法顯然是完全錯誤的,這是一件毫無疑問

的事情。”《英國醫(yī)學期刊》稱韋克菲爾德的研究是“精心策劃的騙局”,英國醫(yī)學總會禁

止韋克菲爾德在英國行醫(yī)。遺憾的是,這個錯誤還是造成了一些損失。到目前為止,已經(jīng)

有數(shù)百名沒有接種的兒童死于麻疹、腮腺炎和風疹,還有數(shù)千名兒童處于危險之中。

2011年,迪爾獲得了英國新聞獎,因為他對韋克菲爾德的調(diào)查“很好地糾正了一個錯誤"。

我們只能祈禱韋克菲爾德的真面目能夠像他的虛假警報一樣得到媒體的大量報道,希望家

長能夠再次允許他們的孩子接種疫苗。

疫苗是一種注射到人體中的病原體,因此人們對疫苗的擔憂存在一定的合理性,尤其

是與孩子的安全有關(guān)的疫苗。不過,那些不合理的結(jié)論呢?人為制造的數(shù)據(jù)能夠使我們相

信那些明顯具有荒謬性的觀點嗎?

迪德里克?斯塔佩爾(DiederikStapel)是一位極為多產(chǎn)、成功的荷蘭社會心理學家,

以設(shè)計全面細致的調(diào)查方案著稱,這些方案通常以研究生或同事為調(diào)查對象。奇怪的是,

作為一名高級研究員,他竟然親自開展調(diào)查,而且很可能是在只有他能夠進入的學校里進

行的。另一件奇怪的事情是,斯塔佩爾常常知道同事的研究興趣,并且聲稱他已經(jīng)收集到

了同事需要的數(shù)據(jù);斯塔佩爾可以提供這些數(shù)據(jù),條件是他需要被列為研究報告的共同作

者。

斯塔佩爾是幾百篇論文的作者或共同作者,他還在2009年獲得了實驗社會心理學會

的職業(yè)軌跡獎。2010年,他當上了蒂爾堡社會和行為科學學院的院長。斯塔佩爾的許多

論文具有爭議性,但是至少看上去比較合理。不過,另一些論文已經(jīng)超出了看似合理的界

限。在一篇論文中,斯塔佩爾聲稱,凌亂的房間會加劇人們的種族主義傾向。在另一篇論

文中,斯塔佩爾認為吃肉一一甚至僅僅是考慮吃肉一一會使人變得更加自私。(是的,我

沒有開玩笑!)

斯塔佩爾的一些研究生對于這些稀奇古怪的理論產(chǎn)生了懷疑,他們想要查看實際數(shù)據(jù),

以了解這些數(shù)據(jù)是如何支持他的理論的。令人失望的是,斯塔佩爾拒絕向他們展示調(diào)查數(shù)

據(jù)。他們把這件事報告給了心理系主任。很快,斯塔佩爾承認,他的許多調(diào)查結(jié)果要么進

行了篡改,要么完全是編造的。他解釋說:“我想以很快的速度做出許多成果。”

2011年,斯塔佩爾被停職,隨后被蒂爾堡大學解雇。2013年,斯塔佩爾放棄了自己

的博士學位,并且撤銷了50多篇含有虛假數(shù)據(jù)的論文。他還同意從事120小時的社區(qū)服

務,并且放棄與18個月薪水相當?shù)睦妗W鳛榻粨Q,荷蘭檢察官同意不對他濫用公共研

究基金的行為提起刑事指控,因為這些政府撥款主要用于支付研究生的工資,而這些研究

生并沒有犯下任何錯誤。與此同時,我們在吃肉和弄亂房間時也可以減少幾分愧疚感。

偽造數(shù)據(jù)的另一個例子涉及超感知覺(ESP)測試。早期超感知覺實驗使用心理學家

卡爾?齊納公爵(DukeKarlZener)設(shè)計的一副紙牌。這副紙牌共有25張牌,包括5種符

號:圓圈、十字、波浪線、方塊和星星。在洗過牌以后,“發(fā)送者”依次查看每張紙牌,

“接收者”需要猜測紙牌上的符號。

、\?\

O+

JJI/

圖1.2五種齊納紙牌

一些懷疑者指出,接收者可以偷看紙牌,或者從發(fā)送者的行為中尋找細微的線索,比

如快速掃視、微笑或者挑眉,從而獲得較高的分數(shù)。沃爾特?利維(WalterJ.Levy)是超

感知覺先驅(qū)J.B.萊因(J.B.Rhine)創(chuàng)立的通靈學研究所主任。為了平息上述批評,利維

用計算機和非人類對象做了一些實驗。在一項實驗中,他把包含小雞胚胎的雞蛋放在孵化

器里,并用一個電燈為孵化器加熱,電燈的開關(guān)由計算機隨機事件生成器控制。隨機事件

生成器開燈的可能性是50%?不過,利維表示,小雞胚胎能夠?qū)τ嬎銠C產(chǎn)生影響,使電

燈打開的時間超過一半。

利維的一些同事對這些“具有心靈感應能力的小雞”產(chǎn)生了懷疑(我倒希望這是真的),

而且對于利維在實驗期間對設(shè)備的過度關(guān)注感到困惑。他們對計算機進行了改動,使之能

夠?qū)⒔Y(jié)果秘密記錄下來。然后,他們躲在一個隱秘的地方,對實驗進行了觀察。他們的擔

憂得到了證實。秘密記錄表明,電燈打開的時間只占總時間的一半。而且,他們看到利維

對設(shè)備進行了干預,將電燈打開的時間提高到了50%以上。面對同事的質(zhì)問,利維承認

了自己的行為,并且辭去了職務。后來,他解釋說,為了發(fā)表論文,他面臨著很大的壓力。

統(tǒng)計顯著性膜拜

不過,我們最感興趣的例子與虛假數(shù)據(jù)無關(guān)。這些例子涉及的做法更加微妙,更加常

見。許多人對統(tǒng)計顯著性非常關(guān)心。這是一種奇怪的宗教,它受到了研究人員近乎盲目地

崇拜。假設(shè)我們想要通過檢驗了解,每天服用阿司匹林能否降低心臟病發(fā)作的風險。理想

情況下,我們會對健康個體的兩個隨機樣本進行比較。一個樣本每天服用阿司匹林,另一

個樣本每天服用安慰劑一一與阿司匹林具有類似外觀、感覺和味道的惰性物質(zhì)。這種檢驗

應當是雙盲檢驗:受試者和醫(yī)生并不知道誰在哪個小組里。否則,病人報告"正確結(jié)果"

(以及醫(yī)生聽到“正確結(jié)果")的可能性也許會高于真實水平。

當研究結(jié)束時,統(tǒng)計學家就會介入進來。這里的統(tǒng)計問題是,在完全隨機的情況下,

兩個小組的差異達到實際觀測值的概率有多大。在大多數(shù)研究人員看來,小于0.05的概

率具有“統(tǒng)計顯著性"。如果數(shù)據(jù)中的模式僅憑運氣出現(xiàn)的可能性不到1/20,這種模式就

會被視作具有統(tǒng)計說服力。章魚保羅的數(shù)據(jù)具有統(tǒng)計顯著性,因為它僅憑運氣得到這種結(jié)

果的可能性不到1%。

在一項涉及2.2萬名男性醫(yī)生的阿司匹林研究的前五年,安慰劑組出現(xiàn)了18個致死

性心臟病發(fā)作案例,阿司匹林組則只出現(xiàn)了5個同樣的案例。在完全隨機的情況下,這種

巨大的差異發(fā)生的概率不到1%。至于非致死性心臟病發(fā)作,安慰劑組有171個案例,阿

司匹林組有99個案例。這種巨大的差異僅憑運氣出現(xiàn)的可能性約為十萬分之一。這些結(jié)

果具有統(tǒng)計顯著性,因此美國心臟學會目前建議心臟病發(fā)病風險較高的患者每天服用阿司

匹林。

另一方面,沒有發(fā)現(xiàn)統(tǒng)計顯著性的結(jié)果有時比發(fā)現(xiàn)統(tǒng)計顯著性的結(jié)果更加重要。

1887年,阿爾伯特?邁克耳孫(AlbertMichelson)和愛德華?莫利(EdwardMorley)測量

了與地球運動方向平行和垂直的光速,希望找到二者之間的差異,以證明當時一種流行的

理論。不過,他們并沒有發(fā)現(xiàn)任何具有統(tǒng)計顯著性的差異。他們的研究為愛因斯坦狹義相

對論的提出和接納奠定了基礎(chǔ)。他們這項“失敗”的研究為物理學革命做出了貢獻。

再說一個更能說明問題的例子。我們將在后面的章節(jié)中討論關(guān)節(jié)鏡手術(shù),這是一種針

對膝骨關(guān)節(jié)炎的常規(guī)程序,每年會進行幾十萬次。最近的研究發(fā)現(xiàn),這種手術(shù)帶來的利益

沒有統(tǒng)計顯著性,這一結(jié)論每年可以節(jié)省數(shù)百萬美元資金,而且可以免去手術(shù)帶來的不便

和并發(fā)癥風險。同許多發(fā)現(xiàn)罕見疾病療法統(tǒng)計顯著性的研究相比,這項沒有在常見手術(shù)中

發(fā)現(xiàn)統(tǒng)計顯著性的研究顯然具有更大的價值。

不過,一項針對心理學期刊的研究發(fā)現(xiàn),在所有得到發(fā)表的檢驗結(jié)果中,97%的結(jié)

果具有統(tǒng)計顯著性。當然,在研究人員進行的所有檢驗中,具有統(tǒng)計顯著性的檢驗比例不

會達到97%。之所以出現(xiàn)上述結(jié)果,是因為編輯通常認為不具有統(tǒng)計顯著性的檢驗沒有

發(fā)表的價值。

這個問題不限于學術(shù)領(lǐng)域。當商業(yè)或政府研究人員試圖證明某個策略、計劃或政策的

價值時,他們往往覺得自己必須展示出具有統(tǒng)計顯著性的經(jīng)驗性證據(jù)。不管是在哪里,研

究人員都在追逐統(tǒng)計顯著性,而這并不是一個難以尋覓的目標。在高速計算機和大量數(shù)據(jù)

的幫助下,尋找統(tǒng)計顯著性是一件很容易的事情。如果你觀察得足夠仔細,你甚至可以在

隨機數(shù)據(jù)表格中發(fā)現(xiàn)統(tǒng)計顯著性。

尋找統(tǒng)計顯著性的一種方法是對多種理論進行檢驗,然后只宣布具有統(tǒng)計顯著性的結(jié)

果。即使只考慮毫無價值的理論,也會有1/20的檢驗表現(xiàn)出統(tǒng)計顯著性。在海量數(shù)據(jù)和

高速計算機的幫助下,在生成"可發(fā)表結(jié)果”的巨大壓力下,無數(shù)毫無價值的理論得到了檢

驗。成千上萬的研究人員對無數(shù)理論進行檢驗,將那些具有統(tǒng)計顯著性的結(jié)果記錄下來,

并將其他結(jié)果扔到一邊。對于社會公眾來說,我們只能看到這些統(tǒng)計工作的冰山一角。我

們只能看到具有統(tǒng)計顯著性的結(jié)果,看不到不具有統(tǒng)計顯著性的結(jié)果。如果我們知道這些

得到公布的檢驗背后隱藏著數(shù)百項沒有得到公布的檢驗,而且知道對毫無價值的理論進行

的檢驗中平均有1/20的檢驗能夠得到統(tǒng)計顯著性,我們一定會抱著更加懷疑的態(tài)度看待

這些得到公布的結(jié)果。

比如說,制藥公司會對數(shù)千種實驗性藥物進行檢驗。即使在設(shè)計良好的無偏研究中,

我們也會發(fā)現(xiàn)數(shù)百種毫無價值的藥物表現(xiàn)出具有統(tǒng)計顯著性的效果一一而這又可以帶來巨

大的利潤。制藥商很喜歡對更多的新藥進行檢驗。不過,他們并不喜歡對得到批準的療法

進行重新檢驗,以查看最初的結(jié)果是否僅僅是一種巧合,是否屬于1/20碰巧具有統(tǒng)計顯

著性的毫無價值的療法。

當?shù)玫脚鷾实寞煼ń邮苤匦聶z驗時,結(jié)果常常令人失望,這是一件意料之中的事情。

約翰?約安尼季斯(Johnloannidis)在希臘約阿尼納大學、馬薩諸塞州塔夫斯大學醫(yī)學院

以及加利福尼亞州斯坦福大學醫(yī)學院任職。(想象一下,他需要飛行多少公里,放棄多少

睡眠時間!)在整個職業(yè)生涯中,約安尼季斯一直在警告醫(yī)生和公眾不要輕易接受沒有以

令人信服的方式得到重復的醫(yī)學檢驗結(jié)果。在一項研究中,他考察了從1990年到2003

年的45項備受尊重的醫(yī)學研究,這些研究自稱證明了對于各種疾病的有效療法。其中,

只有34項實驗被人用規(guī)模更大的樣本進行了檢驗,以復制初始檢驗結(jié)果。在這34項研

究中,只有20項研究證實了初始結(jié)果(59%)。在7種療法中,重新檢驗得到的效果比

最初的預測小得多;另外7種療法的重新檢驗沒有產(chǎn)生任何效果。總體而言,在45項研

究中,只有20項研究得到了復制,而且這還是最受人尊重的研究!就在約安尼季斯發(fā)表

這些令人不安的結(jié)果的同一年,他還寫了另一篇文章,文章的標題很不討好,叫做"為什

么大多數(shù)得到發(fā)表的研究結(jié)果都是錯誤的”。

另一種獲得統(tǒng)計顯著性的方法是利用數(shù)據(jù)發(fā)現(xiàn)理論。統(tǒng)計檢驗的假設(shè)是,研究人員首

先提出一種理論,然后收集數(shù)據(jù),以檢驗這種理論,然后匯報結(jié)果一一這種結(jié)果可能具有

統(tǒng)計顯著性,也可能不具有顯著性。許多人顛倒了這種程序,他們仔細研究數(shù)據(jù),以發(fā)現(xiàn)

某種模式,然后編造出符合這種模式的理論。在數(shù)據(jù)中搜尋模式的過程令人愉快,而且激

動人心,就像玩數(shù)獨或者解決神秘謀殺案一樣。這些人從各個角度考察數(shù)據(jù),將數(shù)據(jù)分解

成基于性別、年齡和種族的類別,丟掉妨礙模式的數(shù)據(jù),尋找任何有趣的現(xiàn)象。當他們發(fā)

現(xiàn)某種模式時,他們開始思考其中的原因。

當研究人員鉆研數(shù)據(jù)、尋找模式時,他們會進行數(shù)百次顯性或隱性檢驗。你可以站在

他們的立場上進行考慮。首先,你將數(shù)據(jù)作為一個整體進行考察。然后,你分別查看男性

和女性的數(shù)據(jù)。接著,你將兒童和成年人的數(shù)據(jù)區(qū)分開;然后將兒童、青少年和成年人的

數(shù)據(jù)區(qū)分開;然后將兒童、青少年、成年人和老年人的數(shù)據(jù)區(qū)分開。接著,你嘗試不同的

年齡界限。你將老年人的范圍設(shè)置為65歲以上。當這種做法失敗時,你將這個數(shù)字調(diào)整

為55歲、60歲、70歲或者75歲。最終,你總會發(fā)現(xiàn)某種模式。即使研究人員不對數(shù)據(jù)

的每一種排列進行正式的統(tǒng)計檢驗,他們也可以進行非正式檢驗,即尋找看上去具有統(tǒng)計

顯著性的數(shù)據(jù)排列。如果我們知道研究人員在公布結(jié)果之前以一百種不同的方式對數(shù)據(jù)進

行了考察,我們一定會抱著懷疑的態(tài)度看待這些結(jié)果。

這些做法一一選擇性報告和數(shù)據(jù)搜刮一一被稱為數(shù)據(jù)挖掘。通過數(shù)據(jù)挖掘發(fā)現(xiàn)的統(tǒng)計

顯著性只能體現(xiàn)出研究人員的耐心。在獨立檢驗證實或拒絕結(jié)論之前,我們無法判斷某種

數(shù)據(jù)挖掘馬拉松到底證明了某種實用理論的有效性還是研究人員堅定的毅力。不過,通常

情況下,這類檢驗并不會被人驗證。畢竟,你無法通過證實他人的研究而成為明星;所以,

為什么不把時間用于發(fā)現(xiàn)新理論呢?因此,通過數(shù)據(jù)挖掘得出的理論看上去很安全,既不

會受到檢驗,也不會受到質(zhì)疑。

許多重要的科學理論的確是人們?yōu)榱私忉屗麄兯l(fā)現(xiàn)的模式而提出來的。例如,在

19世紀,大多數(shù)生物學家認為,親代性狀的平均值決定了后代性狀。例如,孩子的身高

是由父母身高的平均值決定的,同時也可能受到環(huán)境的影響。

奧地利修士格雷戈爾?孟德爾(GregorMendel)在8年時間里對幾萬株豌豆進行了細

致的研究。他對一些不同性狀進行了考察,認為當時的混合理論是說不通的。當他對綠色

種子的植株和黃色種子的植株進行異花授粉時,后代的種子要么是綠色的,要么是黃色的,

沒有黃綠色的種子。當他對圓粒種子植株和皺粒種子植株進行異花授粉時,后代的種子要

么是圓粒的,要么是皺粒的,沒有處于兩者之間的種子。為了解釋這些實驗結(jié)果,孟德爾

提出了“孟德爾遺傳定律”,這個優(yōu)雅的概率模型解釋了性狀的代際傳遞以及偶爾發(fā)生的隔

代傳遞。他構(gòu)造出了一種與數(shù)據(jù)相符的理論,為現(xiàn)代遺傳學奠定了基礎(chǔ)。

不過,數(shù)據(jù)挖掘還導致了數(shù)千種胡諂理論。我們?nèi)绾螀^(qū)分正確理論與胡諂之間的區(qū)別?

有兩種有效的良方:常識和新數(shù)據(jù)。如果某種理論聽起來很可笑,那么在看到壓倒性的證

據(jù)之前,我們絕不應該輕信這種理論;即使看到了壓倒性的證據(jù),我們也應當保持懷疑的

態(tài)度。不同尋常的說法需要不同尋常的證據(jù)。遺憾的是,在這個年代,常識是一種稀缺品,

許多誠實的研究人員用嚴肅的語氣提出了一些愚蠢的理論。你知道嗎?有人認為入選名人

堂會使棒球選手的壽命預期減少五年。還有人認為一些中國人由于出生在“火年”而死于心

臟病。本書稍后會對這些例子進行介紹。

第二種良方是新數(shù)據(jù)。當你通過搜刮數(shù)據(jù)編造出了某種理論時,用同樣的數(shù)據(jù)對這種

理論進行檢驗是一種不明智的做法。既然你編造這種理論是為了迎合數(shù)據(jù),那么這些數(shù)據(jù)

當然會支持這種理論!應當使用沒有被數(shù)據(jù)挖掘所污染的新數(shù)據(jù)對理論進行檢驗。

當你用新數(shù)據(jù)檢驗通過數(shù)據(jù)挖掘形成的理論時,得到的結(jié)果常常令人失望,這是意料

之中的事情。用啟發(fā)某種理論的數(shù)據(jù)對這種理論進行檢驗的做法顯然具有誤導性。如果某

種理論對新數(shù)據(jù)的匹配程度不像原始數(shù)據(jù)那么好,這顯然并不奇怪。

舉個例子。我剛剛用左手小指彈開了桌子上的一枚25美分硬幣,硬幣落地時背面朝

上。看到這一結(jié)果,我得出了一種理論:如果我用左手小指將桌子上的25美分硬幣彈開,

那么它在落地時總會背面朝上。畢竟,我的數(shù)據(jù)可以支持這種理論。這種理論顯然愚蠢而

毫無用處,但我們在后面幾章將要詳細考察的一些理論也是如此,這些理論雖然不那么容

易被看穿,但它們與我的彈硬幣理論具有相同的推導方式。如果死于癌癥的孩子生活在輸

電線附近,那么輸電線的電磁場(EMF)一定是導致癌癥的元兇,不是嗎?如果某種理論

看上去比較合理,而你又不知道這種理論是通過觀察數(shù)據(jù)得到的一一比如觀察地板上的硬

幣一一那么你很容易不假思索地認為與數(shù)據(jù)相符的理論一定是正確的。畢竟,這種理論能

夠得到數(shù)據(jù)的證明!這是你應當抗拒的幾種沖動之一。

幸運的是,我們能夠抗拒這種沖動。我們能夠克服我們的遠古祖先在生存和繁衍的斗

爭中形成的偏好。我們可以擺脫數(shù)據(jù)的欺騙。

x如何輕松識破一本正經(jīng)地胡說八道

我們通常傾向于尋找模式并且相信我們所觀察到的模式是有意義的。如果棒球選手在

穿上新襪子以后在比賽中表現(xiàn)出色,那么他不應該換襪子。如果股票市場在NFC球隊贏

得超級碗以后表現(xiàn)出色,那么你應該首先觀看比賽,然后再去投資。如果籃球選手連續(xù)四

次投籃命中,這說明他的狀態(tài)很好,很有可能在下次投籃時命中。如果心臟病患者在

1600公里以外的人發(fā)送治療意念以后恢復正常,這說明遠距離治療是有效的。如果一項

顧客滿意度調(diào)查發(fā)現(xiàn)家里擁有三間浴室的人比家里擁有兩間浴室的人更加熱情,這說明前

者才是企業(yè)的目標市場。如果一個國家在聯(lián)邦債務很高時發(fā)生了衰退,這說明政府債務導

致了衰退。在這本書中,我們將對幾十個類似的例子進行反駁。

不要天真地認為模式就是證據(jù)。我們需要一個符合邏輯、具有說服力的解釋,并且需

要用新數(shù)據(jù)對這種解釋進行檢驗。

第2章

不再神奇的超級暢銷書

1791年12月26日,查爾斯?巴貝奇(CharlesBabbage)出生于倫敦。那是一個科技

和社會流動性發(fā)生巨大變革的時代。巴貝奇對數(shù)學非常感興趣,但他對數(shù)學和天文學表格

中的人為計算錯誤感到非常沮喪。這些錯誤不僅僅是智力上的失敗,它們還會帶來嚴重的

后果,包括致使船長將輪船駛?cè)氚到竻^(qū)或者其他危險地帶。

當時,在高貴的英國人看來,關(guān)注法國數(shù)學家是一種不愛國的行為。不過,巴貝奇還

是這樣做了。他發(fā)現(xiàn)法國政府利用一種自動人工系統(tǒng)制作了一些數(shù)學表格。在這個系統(tǒng)中,

高級數(shù)學家確定填充表格所需要的公式,初級數(shù)學家將這些公式簡化成加減運算。例如,

在計算4x8時,我們可以將其簡化成加法:8+8+8+8=32。最底層的加減運算是由專業(yè)人

員完成的,這些專業(yè)人員被稱為“計算員”。

巴貝奇意識到,從理論上說,人們可以設(shè)計出以100%準確率進行加減運算的機器,

從而消除人為錯誤。巴貝奇還知道兩個德國人(威廉?席卡德和戈特弗里德?威廉?萊布尼茨)

以及偉大的法國數(shù)學家布萊士?帕斯卡(BlaisePascal)設(shè)計的計算機。帕斯卡的父親是法

國收稅員,因此他在十幾歲的時候設(shè)計了一臺機械計算機,叫做“阿里特馬提克"(又叫

“帕斯卡利娜”),以便為他的父親提供幫助。"阿里特馬提克”是一個盒子,上面帶有一些

表盤,它們與盒子里隱藏的輪子相連。每個表盤上標有0到9十個數(shù)字。當個位表盤從9

移動到0時,十位表盤就會向上移動一個刻度;當十位表盤從9移動到0時,百位表盤就

會向上移動一個刻度;依此類推。“阿里特馬提克“可以進行加減運算,但是表盤需要手工

轉(zhuǎn)動。

巴貝奇將兩種思想(將復雜公式轉(zhuǎn)化成簡單計算以及簡單計算的自動化)融合在一起,

設(shè)計出了一臺機械計算機,可以完美地執(zhí)行所有計算任務。作為巴貝奇的第一項設(shè)計,這

臺由銅和鐵制造、由蒸汽驅(qū)動的龐然大物高達2.4米,重達15噸,包含2.5萬個不同部

件,被稱為“差分機"。這臺“差分機”可以進行多達20個數(shù)位的運算,而且可以將結(jié)果打

印成格式化表格。在對這項設(shè)計進行了10年的小修小補以后,巴貝奇開始規(guī)劃一臺更加

強大的計算機,叫做“分析機”。這項設(shè)計包含5萬多個部件,使用穿孔卡片輸入指令和數(shù)

據(jù),可以存儲多達一千個50位數(shù)字。“分析機”有一個高達4.5米、直徑為1.8米的圓柱形

“工廠",可以執(zhí)行一個7.5米長的“存儲器”發(fā)送的指令。這個“存儲器”相當于現(xiàn)代計算機

的內(nèi)存,"工廠"相當于現(xiàn)代CPU。

巴貝奇的核心原則非常合理,與現(xiàn)代計算機的工作原理類似。不過,考慮到當時的技

術(shù)水平,他所提出的機械設(shè)計極為龐大,而且他需要不斷面對資金限制以及所需部件短缺

的困擾。盡管如此,他的宏大視野和對細節(jié)的關(guān)注仍然使人感到震撼,因此他的大腦(發(fā)

明了計算機的大腦)一直被保存到了今天,并被展示在英國皇家外科醫(yī)師學院里。

1991年,在巴貝奇誕辰200周年之際,倫敦科學博物館根據(jù)巴貝奇最初的計劃制作

了幾臺計算機,包括第二代差分機。這臺機器和他預想的一樣精確,可以進行多達31個

數(shù)位的計算。2011年,有人開展了一個名為“第28號計劃”的私人非營利項目,用于制造

巴貝奇的分析機,希望用巴貝奇領(lǐng)先時代一百年的超前思維激發(fā)我們的靈感。項目預計將

在2021年巴貝奇逝世150周年之前完工。

由于巴貝奇的思想比他的時代領(lǐng)先了一個世紀,因此許多人對他的想法感到困惑。他

在自傳中回憶道:

有兩次,(國會成員)問我:"請問,巴貝奇先生,如果你把錯誤的數(shù)字輸入到機器

里,機器會輸出正確答案嗎?”……我不太理解引發(fā)這種問題的混亂思想。

即使是在計算機已經(jīng)普及的今天,許多具有良好出發(fā)點的人仍然堅持著這種錯誤觀念:

由于計算機不會犯下運算錯誤,因此它們是絕對可靠的。哈佛校友雜志2014年的一篇文

章聲稱:"只要能夠?qū)ψ銐蚨嗟男畔⑦M行量化,現(xiàn)代統(tǒng)計方法一定能夠得出比一個人或者

一小部分人更加正確的結(jié)論。"我們可以認為這種說法由于過于拐彎抹角而失去了意義,

也可以認為這種說法是完全錯誤的。

事實上,如果我們讓計算機去做一些愚蠢的事情,它也會忠實地遵從我們的命令。有

一句俗語叫做"輸入垃圾,輸出垃圾"。也就是說,不管計算機多么強大,輸出的價值僅僅

取決于輸入的質(zhì)量。這種說法的另一個版本叫做“輸入垃圾,輸出福音”,它意味著人們往

往過度相信計算機生成的結(jié)果,不會對輸入進行審慎的思考。如果計算機的計算以不良數(shù)

據(jù)為基礎(chǔ),那么它不會輸出福音,只會輸出垃圾。

遺憾的是,許許多多的人盲目崇拜基于誤導性數(shù)據(jù)的計算。下面是幾個例子。

去最好的學校

《紐約時報》華盛頓分部主任戴維?萊昂哈特(DavidLeonhardt)關(guān)于經(jīng)濟主題的作

品獲得了包括普利策獎在內(nèi)的多個獎項。2009年,他為《紐約時報》撰寫了一篇專欄文

章,對《穿越終點線》一書作了介紹。此書是由兩位前大學校長威廉?鮑文(William

Bowen)和邁克爾?麥克弗森(MichaelMcPherson)以及一位博士研究生共同撰寫的,其

中后一位作者負責的很可能是分析68所大學20萬學生數(shù)據(jù)的繁重工作。這本書的核心

觀點是,美國在“說服學生上大學”方面表現(xiàn)不錯,但在“培養(yǎng)學生從大學畢業(yè)”方面則表現(xiàn)

得不太理想。半數(shù)大學生無法畢業(yè)。

他們發(fā)現(xiàn)的第一個“罪魁禍首"是匹配不足:一些學生本來可以去畢業(yè)率較高的大學,

但他們卻選擇了畢業(yè)率較低的大學。鮑文教授告訴萊昂哈特:“許多來自貧困家庭的學生

本來有更好的選擇,但他們并沒有就讀適合自己的學校,這使我感到極為震驚。”總體而

言,在學分積點高于3.5、大學入學考試成績高于1200分的低收入準大學生中,大約有

一半的人并沒有選擇更好的學校。

例如,90%的密歇根大學學生可以在6年內(nèi)畢業(yè)。在東密歇根大學,這個比例只有

40%。許多成績足以進入密歇根大學的學生選擇了東密歇根大學。要想從經(jīng)濟上解決這種

匹配不足的問題,我們可以提高東密歇根大學的學費,或者降低密歇根大學的學費,以激

勵學生選擇畢業(yè)率更高的學校。

實際情況并沒有這么簡單。這些數(shù)據(jù)都是垃圾,結(jié)論也不是什么福音。如果讓這些所

謂的“匹配不足”的學生就讀密歇根大學,他們的畢業(yè)率可能會變得更低。研究人員認為這

些學生是隨機分配到密歇根大學或東密歇根大學的,就像醫(yī)生被隨機分配阿司匹林或安慰

劑一樣。不過,大學決策并不是科學實驗。

當數(shù)據(jù)涉及人們的選擇時(比如當人們選擇上大學、結(jié)婚或者要孩子時),就會出現(xiàn)

"自選擇偏差”。在這種情況下,對于做出不同選擇的人進行比較的做法是靠不住的。例如,

我們常常聽人說,大學畢業(yè)生的工資高于高中畢業(yè)生,似乎人們觀察到的工資差異可以衡

量上大學的財務回報。不過,大學畢業(yè)生之所以工資比較高,部分原因在于他們比不上大

學的人更聰明,更有抱負。實際上,做出不同選擇的人本身可能就是不同的。

類似地,上述"匹配不足”的觀點也存在自選擇偏差。學生不僅會選擇上大學,他們還

會選擇上哪所大學。許多學生之所以選擇東密歇根大學,而不是密歇根大學,也許是因為

他們覺得自己很難從密歇根大學畢業(yè)。這可能是正確的選擇。畢竟,他們比我們更了解自

己的情況。雖然東密歇根大學的總體畢業(yè)率較低,但我們無法從數(shù)據(jù)中判斷出是否每個能

夠上密歇根大學但選擇了東密歇根大學的學生都能畢業(yè)。

在我們通過觀察人們的行為而收集的“觀測性數(shù)據(jù)”中,自選擇偏差非常普遍。人們可

以選擇自己的行為,因此他們的選擇也許反映了自身的特點。要想避免這種自選擇偏差,

可以進行對照實驗,即將人們隨機分配到不同的小組里,然后告訴他們應該怎樣做。不過,

研究人員很少有權(quán)力僅僅由于自己需要實驗數(shù)據(jù)而強迫我們?nèi)プ鲎约翰幌胱龅氖虑椋@對

我們所有人來說都是一件幸運的事情。

要想進行有效的“匹配不足"研究,我們可以將那些同時被密歇根大學和東密歇根大學

錄取的學生隨機分配到某一所大學里。然后,我們可以對兩個小組的畢業(yè)率進行比較。實

際上,在20世紀60年代,有人曾在密歇根州伊普西蘭提市做過類似的事情,盡管這聽

起來有些不可思議。當時.,在一項實驗性學前教育計劃中,人們根據(jù)拋硬幣的結(jié)果決定是

否允許家庭社會經(jīng)濟地位不高的黑人孩子進入學前班。這項研究發(fā)現(xiàn),上過學前班的學生

高中畢業(yè)和找到工作的可能性較高,被逮捕的可能性較低。這項實驗證明了學前教育的價

值,盡管它對輸?shù)粲矌庞螒虻暮⒆觼碚f似乎有些殘酷。

巧合的是,東密歇根大學就在伊普西蘭提市。更加巧合的是,2012年,東密歇根大

學錯誤地向7700名學生(學生總數(shù)的三分之一)發(fā)送了電子郵件,稱他們遭到了學校的

開除。校長為這個“不可原諒的錯誤"道了歉。如果這些學生真的被開除,學校的畢業(yè)率將

會變得更低。

萊昂哈特《紐約時報》專欄的一位讀者發(fā)表了一條評論,認為教育質(zhì)量比畢業(yè)率更加

重要。(否則,我們可以拋棄論文、考試和出勤等令人討厭的要求,直接向所有學生發(fā)放

文憑,將畢業(yè)率提升至100%。)萊昂哈特回復道:"大學畢業(yè)生的平均工資比大學輟學

生高出54%,所以學位看上去顯然具有經(jīng)濟意義。”這又是一種自選擇偏差!選擇上大學

并通過努力學習獲得學位的學生顯然與大學輟學生存在系統(tǒng)性差異。

投票人數(shù)越多越好?

美國只有大約一半的合格選民在總統(tǒng)選舉中投票。為了提高這個百分比,一個有趣的

建議是將不投票的人的名字張貼在當?shù)貓蠹埢蛘呋ヂ?lián)網(wǎng)上,以便使他們感到羞愧。2014

年,《紐約時報》提出了一個更加激進的解決方案:

懲罰和監(jiān)禁是導致人們不再參與政治(比如投票或政治實踐)的兩個原因……一份針

對美國城市最邊緣群體的大規(guī)模調(diào)查發(fā)現(xiàn),在曾被警察攔截和盤問的群體中,投票概率降

低了8%;在曾被逮捕的群體中,投票概率降低了16%;在被定罪的群體中,投票概率降

低了18%;在曾經(jīng)遭到拘留或監(jiān)禁的群體中,投票概率降低了22%。

這段文字顯然暗示了這樣一條信息、:如果減少逮捕和定罪,投票率將得到極大的提高。

在解雇警察之前,別忘了,這些數(shù)據(jù)都是觀測性數(shù)據(jù)。也許,遭到盤問、逮捕和定罪

的人并不是從人群中隨機選擇的。也許,他們曾經(jīng)犯下罪行。也許,不投票的人更有可能

犯罪,減少逮捕和定罪并不會提高投票率。

一醉方休

飲酒是一個長期困擾許多大學的問題,而且常常是輟學的一個驅(qū)動因素。即使校園內(nèi)

部禁酒,一些學生也會令人遺憾地在周圍街區(qū)由于醉酒而遭到逮捕。學生為自己被逮捕而

苦惱,教授為學生不學習而苦惱,家長為大學沒有監(jiān)督和保護自己的兒女而苦惱。

“代替父母’原則意味著大學在法律上擁有保護學生、不讓他們做出錯誤決定的權(quán)力和

職責。這個原則的應用經(jīng)歷了許多波折。不過,許多大學完全有理由感到擔憂。一些學生

和家長曾經(jīng)控告學校沒能盡到家長的義務。逮捕和死亡事件對入學申請也會產(chǎn)生負面影響,

而入學申請又是大學的生命線。

1984年,弗吉尼亞理工學院心理學教授E.斯科特?蓋勒(E.ScottGeller)在美國心理

學協(xié)會的年度會議上發(fā)表了一篇研究論文,介紹了他在弗吉尼亞理工學院附近的三家酒吧

里觀察到的現(xiàn)象。(這比待在科學實驗室里要有趣得多!)他發(fā)現(xiàn),平均而言,以桶為單

位要啤酒的人喝下的啤酒是以杯或瓶為單位要啤酒的人的兩倍以上。他的結(jié)論是:“如果

我們禁止使用啤酒桶,飲酒問題將會得到重大改善。”這一結(jié)論在全國范圍內(nèi)得到了發(fā)表。

蓋勒發(fā)表過超過350篇研究論文,并且憑借將行為科學運用到現(xiàn)實生活中的出色表

現(xiàn)獲得了大學校友杰出研究獎和校友服務獎。不過,上面這項研究不在他做過的那些優(yōu)秀

研究的范圍之內(nèi)。根據(jù)常識,我們知道,這項研究中存在自選擇偏差,因為以桶為單位要

啤酒的人一定是想一醉方休,而且他們通常能夠?qū)崿F(xiàn)這個目標。他們也許面臨著某種將花

過錢的啤酒喝完的心理壓力,但即使換成酒杯或酒瓶,豪飲者也不會改變自己大量飲酒的

意愿。

在漫長而多產(chǎn)的職業(yè)生涯中,蓋勒對大學飲酒問題進行了許多研究,在進行上述酒吧

研究的27年以后,在2011年美國心理學協(xié)會會議上,他承認了一個顯而易見的事實:

許多大學生“想要一醉方休……我們在多項研究中指出,他們的意圖會影響他們的行為。如

果他們想要喝醉,那么你很難阻止這件事的發(fā)生。”

放下遙控器

電視頻道如此眾多,精彩節(jié)目卻寥寥無幾。照本宣科的真人秀;由缺乏才能的選手參

與的才藝競賽;某博士告訴人們(可能是演員)他們很優(yōu)秀;某鑒定專家告訴人們(可能

是演員)他們很愚蠢;喜劇節(jié)目不斷出現(xiàn)令人討厭的背景笑聲。也許,看電視時關(guān)掉聲音

會讓人減少幾分痛苦?

美國最受尊重的廣播和電視新聞工作者愛德華R默羅(EdwardR.Murrow)曾說過:

“電視的主要用途是欺騙和孤立我們,轉(zhuǎn)移我們的注意力,逗我們開心。”這是1958年的

事情,那是所謂的“電視黃金時代”。時至今日,情況并沒有任何好轉(zhuǎn)。

科學家很早就知道,看電視會使人的腦電波從敏捷而符合邏輯的貝塔波轉(zhuǎn)變成放松而

發(fā)散的阿爾法波。加里?拉爾森(GaryLarson)制作了一集優(yōu)秀的動畫片,名為《電視機

產(chǎn)生之前的日子》,展示了一家人懶洋洋地躺在地板和沙發(fā)上、盯著一面空白墻壁的情景。

不管你觀看的是空白的墻壁還是閃閃發(fā)光的“燈箱”,這種無須動腦的注視(常常伴隨

著心不在焉的吃喝)都會為你帶來危害。2011年,一群研究人員報告說,在澳大利亞,

每天用6個小時看電視的人比從不看電視的人平均早死5年。簡單計算一下,你會發(fā)現(xiàn),

在25歲以后,每看一個小時電視,壽命預期就會減少22分鐘。你不僅在茫然的凝視中

浪費了一個小時,而且額外失去了22分鐘的生命。考慮到人們一生中看電視的習慣,研

究人員得出的結(jié)論是,如果以法律形式禁止看電視,人們的壽命預期可以提高兩年左右。

和之前一樣,問題在于,這些數(shù)據(jù)是具有自選擇偏差的觀測性數(shù)據(jù)。也許,同那些擁

有更加有趣的事情去做,而且自身健康狀況足以支持他們這樣做的人相比,選擇整天看電

視的人更加安靜,更加抑郁,或者健康狀況不是很理想。要想進行有效的實驗,我們應該

選擇兩個小組,禁止一組看電視,強迫另一組每天看6個小時電視。如果我被隨機分到禁

止看電視的小組,我會感到難過的。

請原諒我的直白

在災難性的滑鐵盧戰(zhàn)役之前的早餐上,拿破侖宣布:“威靈頓是差勁的將軍,英國士

兵是一群烏合之眾;我們將在午飯之前解決戰(zhàn)斗。"對許多人來說,這個故事再一次證明

了法國人令人討厭而又毫無根據(jù)的傲慢。不過,美國運通和法國旅游局的一項研究發(fā)現(xiàn),

大多數(shù)過去兩年對法國進行過一次以上休閑旅游的美國人并不認為法國人不友好。他們究

竟是如何得到這個結(jié)論的呢?

下面是一種方法。假設(shè)一名研究員受雇證明法國是一個休閑旅行的好去處。這名研究

員可以進行一項簡單的調(diào)查,調(diào)查內(nèi)容如下:

1.過去兩年你對法國進行過幾次商務旅行?

2.過去兩年你對法國進行過幾次休閑(非商務)旅行?

3.你是否認為法國人不友好?

假設(shè)大多數(shù)只對法國進行過一次商務旅行的人認為法國人不友好。這也是他們從不自

愿前往法國的原因。研究員將這些人的回答扔到一邊。

假設(shè)大多數(shù)從未去過法國的人認為法國人不友好。這也是他們從不前往法國的原因。

研究員將這些人的回答扔到一邊。

假設(shè)大多數(shù)只對法國進行過一次休閑旅行的人認為法國人不友好。這也是他們從不再

次前往法國的原因。研究員將這些人的回答扔到一邊。

假設(shè)大多數(shù)對法國進行過不止一次休閑旅行的人不認為法國人不友好。太好了!這正

是研究員想要的回答。法國旅游局可以根據(jù)這些回答進行廣告宣傳:大多數(shù)過去兩年對法

國進行過不止一次休閑旅行的美國人不認為法國人不友好。

從字面上看,這種說法是正確的,但它具有欺騙性。這種說法存在自選擇偏差,因為

選擇重返法國的人幾乎一定在上次旅行時玩得很開心。不過,這種說法向人們提供了錯誤

的暗示:大多數(shù)曾經(jīng)去過法國的人希望再次前往法國。

這種偏差隱藏在所有顧客滿意度調(diào)查中。一家航空公司曾經(jīng)打出這樣的廣告:在經(jīng)常

從紐約前往芝加哥的商業(yè)旅行者中,84%的人更喜歡這家航空公司,而不是另一家航空

公司。這個廣告令人困惑的地方在于,在從紐約飛往芝加哥的旅行者中,只有8%的人選

擇這家航空公司。如果84%的旅行者更喜歡這家公司,為什么選擇這家公司的旅客只有

8%呢?

答案是,84%這個數(shù)字所依據(jù)的調(diào)查對象是該公司從紐約飛往芝加哥的一架航班上

的乘客。選擇這家航空公司的旅行者更喜歡這家公司,這沒有什么好奇怪的。真正奇怪的

是,還有16%的旅客更喜歡另一家航空公司。不過,我們很難想象航空公司會打出這樣

的廣告:"在乘坐我公司飛機的旅客中,16%的人感到后悔。”

只有弱者留下來

自選擇偏差并不是觀測性數(shù)據(jù)的唯一潛在問題。20世紀70年代,一項集體訴訟認為

密西西比州戈斯市"佐治亞-太平洋鋸木廠”在初始工作分配和晉升方面歧視黑人。該廠50%

的勞動力是黑人,但大多數(shù)黑人員工進入工廠時從事的是級別最低的工作類型("公用事

業(yè)"),而且從未獲得晉升。

在審訊中,工廠經(jīng)理承認,電工長是工廠里唯一需要事先具備一定技能的工作崗位。

其他所有崗位需要的技能都可以在工作中學習。公司的管理層也證實,雇用和晉升決策具

有主觀性,沒有任何書面程序或具體標準。關(guān)于高級工作崗位黑人相對較少的原因,工廠

經(jīng)理的核心觀點是:“同承擔責任、付出額外的辛苦、延長工作時間相比,黑人更喜歡從

事不需要太多技能的工作。”

美國上訴法院第五巡回法庭并沒有被這種具有侮辱性的觀點說服。他們引用了美國最

高法院在"黑澤爾伍德校區(qū)訴美國案”中的觀點:"在可以證明總體統(tǒng)計性差異的時候,這

種差異本身可以.?????構(gòu)成歧視模式或?qū)嵺`的初步證據(jù)。"他們還補充說:“'差異性對待'案件

通常要求提供歧視動機的證據(jù),而作為一種便捷的歧視機制,公司官員缺乏標準的主觀決

策的證據(jù)可以滿足這種要求。”

法庭的結(jié)論當然是正確的,但其統(tǒng)計性證據(jù)的某個部分卻存在一個被所有人忽視的微

妙缺陷。法庭展示了6年前進入公司入門級公用事業(yè)崗位并且領(lǐng)取相同工資的11名員工

1976年的工資。1976年,5名白人員工的平均工資是3.88美元,6名黑人員工的平均工

資則只有2.99美元。這似乎是工資歧視的明顯證據(jù)。不過,事情并沒有這

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論