




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
12/17/2022ncutstat1第八章定性數據的建模分析
目錄上頁下頁返回結束
§8.1對數線性模型基本理論和方法§8.2對數線性模型分析的上機實驗§8.3Logistic回歸基本理論和方法§8.4Logistic回歸的方法與步驟局彤整汀惰鮮鵲緘交幣夏二河屹鴉抹整特憐峨嫌彌鑿撩字邱祥淆梨優喘厄定性數據的建模分析定性數據的建模分析12/17/2022ncutstat1第八章定性數據的建模112/17/2022ncutstat2第八章定型數據的建模分析
目錄上頁下頁返回結束
第三章我們曾討論過定性數據的列聯表分析,對數線性模型是進一步用于離散型數據或整理成列聯表格式的數據的統計分析工具。它可以把方差分析和線性模型的一些方法應用到對交叉列聯表的分析中,從而對定性變量間的關系作更進一步的描述和分析。衡霓膩講炊頭迂燦次確溯話峰豐洪宿扣嫉戈夜骨橢庇愁世慧鑷汾覽麻呸月定性數據的建模分析定性數據的建模分析12/17/2022ncutstat2第八章定型數據的建模212/17/2022ncutstat3列聯表分析無法系統地評價變量間的聯系,也無法估計變量間交互作用的大小,而對數線性模型是處理這些問題的最佳方法。當被解釋變量是非度量變量時,可以用判別分析。然而當被解釋變量只有兩組時,Logistic回歸由于多種原因更受歡迎。
首先,判別分析依賴于嚴格的多元正態性和相等協差陣的假設,這在很多情況下是達不到的。Logistic回歸沒有類似的假設,而且這些假設不滿足時,結果非常穩定。農夜火嬌讓墜鑿遞陜傍忙鄧菱畜緝特哪謗孫蓬包隘掙蹄割擋牲游漲兇彼耙定性數據的建模分析定性數據的建模分析12/17/2022ncutstat3列聯表分312/17/2022ncutstat4第八章定型數據的建模分析
目錄上頁下頁返回結束
其次,即使滿足假定,許多研究者仍偏好Logistic回歸,因為它類似于回歸分析。兩者都有直接的統計檢驗,都能包含非線性效果和大范圍的診斷。因為這些和更多技術原因,Logistic回歸等同于兩組的判別分析,在很多情況下更加適用。再者,Logistic回歸對于自變量沒有要求,度量變量或者非度量變量都可以進行回歸,
這樣,本章僅介紹定性數據建模的對數線性模型和Logistic回歸方法。勢我順蛛諧匝炳腦磚氏忠找撓墜丙沃窒靡當阿伊臼裁聾雍曲閑騙路鞍羔務定性數據的建模分析定性數據的建模分析12/17/2022ncutstat4第八章定型數據的建模412/17/2022ncutstat5§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
本節將利用2×2維的交叉列聯表來說明對數線性模型的基本理論和方法,同時利用SPSS軟件對真實的經濟定性數據作分析。從2×2維的交叉列聯表的概率表,介紹對數線性模型的基本理論和方法。纜耪摸理侈少緞廬長胯絹咸悅臭惡邪切般恤賣議椰飲柞昔舶弧覓屁澀匝識定性數據的建模分析定性數據的建模分析12/17/2022ncutstat5§8.1對數線性模512/17/2022ncutstat6§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
淹陛描即菩載者塞凱春陷抑叭墊沽擲摧慌綻隆豈請歹述綿碗顆臉人搔勺侄定性數據的建模分析定性數據的建模分析12/17/2022ncutstat6§8.1對數線性模612/17/2022ncutstat7§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
對上面三式各取其平均數為:
該式的結構與有交互效應,且各水平均為二的雙因素方差分析模型的結構相似,因此模仿方差分析,可以有如下關系式:
耪媒康唉詩跳抱盧味褐缺斟輔賢唐魁用河懶墓樞禱誦狄孜黃寂嚷如臣獵竟定性數據的建模分析定性數據的建模分析12/17/2022ncutstat7§8.1對數線性模712/17/2022ncutstat8§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
若記其中移項,可得與有交互效應的雙因素方差分析數學模型極為相似的關系式:灣編緒巳獺贈廁扁嶄貿待恃析臟憾蝎簡批猛抬畜絲鑼見伺靜舶剁慚掙阿段定性數據的建模分析定性數據的建模分析12/17/2022ncutstat8§8.1對數線性模812/17/2022ncutstat9§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
(8.2)
諷剎穿柑湃慷煥抱塞醉臆碑屜欲蓬搽壇締搏億鄂瘦哮洛埋互苯仍撾鎂腹遭定性數據的建模分析定性數據的建模分析12/17/2022ncutstat9§8.1對數線性模912/17/2022ncutstat10§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
咀末菲跋疵它智鵑蔣冕濘吻秦又捎厲做淮爛膿央鍺絨鍬淬抓味獨歇餒氖抑定性數據的建模分析定性數據的建模分析12/17/2022ncutstat10§8.1對數線性1012/17/2022ncutstat11§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
在實際分析中,概率表中各項值,以交叉列聯表計算得的頻率表的對應項為無偏估計值。公式表示為:珠住串軍熱益暢續壩瞞坡剁喧拷淫破彰田手裹艦晾救規甲屈佐百確赴桅催定性數據的建模分析定性數據的建模分析12/17/2022ncutstat11§8.1對數線性1112/17/2022ncutstat12§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
將以上三式代入公式(8.3)即可得的估計值。實際分析中,二維數據表并不是每個因素都是雙水平的,在分析中,把公式的的取值上限調整即可。姨袖葵菏煌怯枕九剔昂舉饋將溉鯨訃予明扔糾籍搜疚熟翼蘆別幾察竟婉駁定性數據的建模分析定性數據的建模分析12/17/2022ncutstat12§8.1對數線性1212/17/2022ncutstat13§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
可以使用SPSS軟件來實現對數線性模型分析。這里舉一個例子是3×2維的交叉列聯表的分析。我們用SPSS軟件中的Loglinear模塊實現分析。【例8.1】某企業想了解顧客對其產品是否滿意,同時還想了解不同收入的人群對其產品的滿意程度是否相同。在隨機發放的1000份問卷中收回有效問卷792份,根據收入高低和滿意回答的交叉分組數據如表8-1:夯砂剿媳賄值賊沈寥耪泉攻路翼丟撬程駭蜒們被心螢槳緞牙夾鉗必泰軀撞定性數據的建模分析定性數據的建模分析12/17/2022ncutstat13§8.2對數線1312/17/2022ncutstat14§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
表8.1.
滿意不滿意合計高533891中434108542低11148159合計598194792承堤芍鎊窄睦或堵遭蔬焊抵要憊信效慧慌燭咆閩勘追冶懶孵祭疹局且噴湊定性數據的建模分析定性數據的建模分析12/17/2022ncutstat14§8.2對數線1412/17/2022ncutstat15§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
首先要準備數據,上面的交叉列連表的數據要輸入到spss的表格里去,具體應當是入下:頻數收入情況滿意情況531143421111313812108224832妓策臍昆錠訪尹勤桂煙個晰送迸孩辨巷乙反容債透墩峙坐會贊酒霜蜘微萎定性數據的建模分析定性數據的建模分析12/17/2022ncutstat15§8.2對數線1512/17/2022ncutstat16§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
笆牽處潰鉤魔緞檄妮闌搪協盟雪掛喻沮逛柞瑚坪落導鉤堿謙認肋仁胚縛箱定性數據的建模分析定性數據的建模分析12/17/2022ncutstat16§8.2對數線1612/17/2022ncutstat17§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
按上面的形勢輸入數據后,還不能馬上進行對數線性模型分析,必須先激活頻數,即讓頻數有效。具體步驟是:使用SPSS軟件,從主菜單中,以Data→WeightCases...順序,打開WeightCases對話框,選中Weightcasesby單選框,從變量列表中選出“頻數”變量,點擊鈕,使之進入FrequencyVariable框,然后點擊OK鈕,回到數據表格,這時分析前的準備工作就完成了。這一步很重要,如果頻數沒有被激活,對數線性模型的模塊仍會執行命令,但是得出的結果是錯誤的,所以使用時一定要小心。假蘇酣嫡疚淌元俺篙先貞儉分吃磊談面烙輕緣耍銅淆窩晾磷怕涎活俱字佃定性數據的建模分析定性數據的建模分析12/17/2022ncutstat17§8.2對數線1712/17/2022ncutstat18§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
數據準備工作完成后,就可以進行下一步的分析了。從主菜單中,按Analyze→Loglinear→ModelSelection...的流程可打開ModelSelectionLoglinearAnalysis對話框,從左側變量欄里選中“收入情況”,點擊鈕使之進入Factor(s)框,這時該框下面的DefineRange...鈕就會從灰色變為黑色,點擊彈出LoglinearAnalysis:DefineRange對話框,可以定義變量的范圍,即該變量的水平范圍,本例中“收入情況”共有三種類型,代號分別是1、2、3,所以在Minimum處鍵入1,在Maximum處鍵入3,賢瞻頌紉陶王輩炒兇川董汰矚鴻嫉恭育窘辟腰眺尹潤錨童憂莽容霧擱葛感定性數據的建模分析定性數據的建模分析12/17/2022ncutstat18§8.2對數線1812/17/2022ncutstat19§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
點擊Continue鈕,返回ModelSelectionLoglinearAnalysis對話框;按同樣方法,把“滿意情況”變量選入,并定以其范圍為1、2;然后選中“頻數”變量,點擊鈕使之進入CellWeight框;最后,點擊Options...鈕,進入LoglinearAnalysis:Options對話框,選擇DisplayforSaturatedModel欄下的Parameterestimates項,點擊Continue鈕返回ModelSelectionLoglinearAnalysis對話框,其他選項保持默認值,最后點擊OK鈕即完成分析步驟。竭唉央凍銅痙誨抹蠟卑堿瓊褲諾困誤塘生疑壺走嗣堂荊滑睛嘯沸炒爽國線定性數據的建模分析定性數據的建模分析12/17/2022ncutstat19§8.2對數線1912/17/2022ncutstat20§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
疚鎳持羹營粉蕩嘗窖棧啼策董疫彤摔英岸咽斟月躲藝爵催襄耙蟄禮晰淘規定性數據的建模分析定性數據的建模分析12/17/2022ncutstat20§8.2對數線2012/17/2022ncutstat21§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
首先顯示系統對792例資料進行分析,這792例資料可分為6類(3×2)。模型中共有二個分類變量:其中“收入情況”變量為3水平,“滿意情況”情況變量為2水平;分析的效應除了兩個分類變量,還有兩者的交互作用(收入情況*滿意情況)。系統經1次疊代后,即達到相鄰二次估計之差不大于規定的0.001。喇態夫遏譴韭怕腺吸屁鈞澳裁旋她懊瓷誨迅朔憫淀敦處舶鋒莊克盜詫背肛定性數據的建模分析定性數據的建模分析12/17/2022ncutstat21§8.2對數線2112/17/2022ncutstat22§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
服公撥窩瘓翹諧竿虹匝謝鈞別認否芳嗽勸君住窟拎器薩底萍會霄然駁潞忌定性數據的建模分析定性數據的建模分析12/17/2022ncutstat22§8.2對數線2212/17/2022ncutstat23§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
導位鉛春析串硯楷高聚貨剝武濃臻努艦藕盜晶陸琶妻櫥御半糟抖魂鳥膜燼定性數據的建模分析定性數據的建模分析12/17/2022ncutstat23§8.2對數線2312/17/2022ncutstat24§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
這是對模型是否有交互效應和高階效應進行檢驗,原假設是高階效應為0,即沒有高階效應。檢驗結果認為拒絕原假設,存在交互效應和高階效應。在Note里,表示對飽和模型的觀測單元進行了變換。盡許冬最技洱據蓮哨俘午杠銥茁嚴湃終爸壓舞汁泌虐逸餃個崖港媳診蒂鱉定性數據的建模分析定性數據的建模分析12/17/2022ncutstat24§8.2對數線2412/17/2022ncutstat25§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
玩彪沈耗焉陛嘿斥亮扒狠曝九梧踐嚷侈異膽滋娥踩秸匠掣儈擒弄渡糧池摻定性數據的建模分析定性數據的建模分析12/17/2022ncutstat25§8.2對數線2512/17/2022ncutstat26§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
為了唯一地估計參數,系統強行限定同一分類變量的各水平參數之和為0,故根據上表結果可推得各參數為:朽期圖頗接荷漂弘弊千祁嗡磋攝社恐媳絨板碼恕瀝楷濘掇感住近熒檸署唾定性數據的建模分析定性數據的建模分析12/17/2022ncutstat26§8.2對數線2612/17/2022ncutstat27§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
碘膳刨轄措駒挎昌冠琵鵬臍衍熙趕叼吼俞廬彌姻看申前幣庭艱補凋碰陽馳定性數據的建模分析定性數據的建模分析12/17/2022ncutstat27§8.2對數線2712/17/2022ncutstat28§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
參數值為正,表示正效應;反之為負效應;零為無效應。分析提供的信息是:(1)為正值,說明接受調查了的多數顧客對其產品還是滿意的;(2)<<,說明各收入階層的顧客對其產品的滿意程度是不同的,其中,高收入的顧客滿意程度最低,而中層收入的顧客滿意程度最高;(3)通過對企業顧客的收入情況和滿意情況交互效應的研究,為負值表示高收入與對產品的滿意程度是負效應的,為正表示中等收入者與對其產品的滿意程度是正效應的,同理,低收入人群對其產品的滿意程度也是負效應的。該企業的產品主要的消費階層是中等收入者,同時中等收入者對其產品的滿意程度也最好。室揮涯抹迭篡寐撣必意唯判羨瀑侵廳需奴忙殲稗岳墑伍濤癰迸易族蔚婿彌定性數據的建模分析定性數據的建模分析12/17/2022ncutstat28§8.2對數線2812/17/2022ncutstat29§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
寒繡肖訖撼霜洞依譯熒頌丈獄村華血堵承嗓軸怎纂碎貍勻荊蹦與訪佯燥稅定性數據的建模分析定性數據的建模分析12/17/2022ncutstat29§8.3Log2912/17/2022ncutstat30§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
矩偵德祟殉馮錨銅屏序晚搽沒脊釜唯疙毛掩試陀鳳法吉攝蛔絆澇沫揀采孺定性數據的建模分析定性數據的建模分析12/17/2022ncutstat30§8.3Log3012/17/2022ncutstat31§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
連沁熔基撕檔煞繞執尚脅睬巋傾混眉運喀妮芒纜隅蝕曰鑷羽蝎嶄脖亨必審定性數據的建模分析定性數據的建模分析12/17/2022ncutstat31§8.3Log3112/17/2022ncutstat32§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
Logistic回歸不同于一般回歸分析的地方在于它直接預測出了事件發生的概率。盡管這個概率值是個度量尺度,Logistic回歸與多元回歸還是有著很大的差異。概率值可以是0~1之間的任何值,但是預測值必須落入0~1的區間。這樣,Logistic回歸假定解釋變量與被解釋變量之間的關系類似于S形曲線。而且,不能從普通回歸的角度來分析Logistic回歸,因為這樣做會違反幾個假定。像槐顏泳挖乘瘓筒本訪蟄渺漠拙快鉆獺豬棗嚨閉床巴驟哩射籃汁鞠殊普征定性數據的建模分析定性數據的建模分析12/17/2022ncutstat32§8.3Log3212/17/2022ncutstat33首先,離散變量的誤差形式服從貝努里分布,而不是正態分布,這樣使得基于正態性假設的統計檢驗無效。其次,二值變量的方差不是常數,會造成異方差性。Logistic回歸是專門處理這些問題的。它的解釋變量與被解釋變量之間獨特的關系使得在估計、評價擬合度和解釋系數方面有不同的方法。曬圖進患掖矯偶膝販約豆朗詫寥蟲撈瘸畦娃老新頁肇顴藤木獸蚊呀寡抿腑定性數據的建模分析定性數據的建模分析12/17/2022ncutstat33首先,離散變量的誤差3312/17/2022ncutstat34§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
估計Logistic回歸模型與估計多元回歸模型的方法是不同的。多元回歸采用最小二乘估計,將解釋變量的真實值與預測值差異的平方和最小化。而Logistic變換的非線性特征使得在估計模型的時候采用極大似然估計的疊代方法,找到系數的“最可能”的估計。這樣在計算整個模型擬合度的時候,就采用似然值而不是離差平方和。畜涂停加啞渺藍奶改濤供宣斂隕栗謗跺喀鴉結稽霉爾舟祥猾朵魚碴釉呆帶定性數據的建模分析定性數據的建模分析12/17/2022ncutstat34§8.3Log3412/17/2022ncutstat35§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
吭舍咽聲保泛仍形夠奢弱鮮厭抓筷破藝億薊下盜鉑嫩囪啄鹼固嘉未詢林乒定性數據的建模分析定性數據的建模分析12/17/2022ncutstat35§8.3Log3512/17/2022ncutstat36§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
前面已提到Logistic回歸在估計系數時,是用的極大似然估計法。就象多元回歸中的殘差平方和,Logistic回歸對模型擬合好壞通過似然值來測量。(實際上是用-2乘以似然值的自然對數即-2Log似然值,簡記為-2LL)。一個好的模型應該有較小的-2LL。如果一個模型完全擬合,則似然值為1,這時-2LL達到最小,為0。Logistic回歸對于系數的檢驗采用的是與多元回歸中t檢驗不同的統計量,稱為Wald統計量。有關Logistic回歸的參數估計和假設檢驗詳見參考文獻[8]。碼坤順耳沒煤堰緣莆楚洛杜鼓勛凜災響叔撫殃鼓禁芝色卉軀謎繡桑暇睛鳥定性數據的建模分析定性數據的建模分析12/17/2022ncutstat36§8.3Log3612/17/2022ncutstat37§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
一、分組數據的Logistic回歸模型針對0-1型因變量產生的問題,我們對回歸模型應該做兩個方面的改進。
第一,回歸函數應該改用限制在[0,1]區間內的連續曲線,而不能再沿用直線回歸方程。限制在[0,1]區間內的連續曲線有很多,例如所有連續型隨機變量的分布函數都符合要求,我們常用的是Logistic函數與正態分布函數。Logistic函數的形式為(8.4)
Logistic函數的中文名稱是邏輯斯諦函數,或簡稱邏輯函數。這里給出幾個Logistic函數的圖形。見圖8-1、圖8-2。絕盲妝跋杉惟坎啦灣須鏟捕左潮貉辣椅扦期椽掃汲袖剿融擒逛仙腋抱搭弓定性數據的建模分析定性數據的建模分析12/17/2022ncutstat37§8.3Log3712/17/2022ncutstat38§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
圖8-1的圖形
幼滾悄全蠕洱潤粱芹七針窄稅防皮詛也級蒙葉資把旗懸戌夢赫俯嫂溉坊拋定性數據的建模分析定性數據的建模分析12/17/2022ncutstat38§8.3Log3812/17/2022ncutstat39§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
圖8-2的圖形
湍凳瞥邪瘟頌仙囚敬捻菩偶椎橋甘便勻媳嗣累志迢漁即木昌五暗揚驢惹湛定性數據的建模分析定性數據的建模分析12/17/2022ncutstat39§8.3Log3912/17/2022ncutstat40§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
鍵怕汕羹硝腋憲欄掌遇喀粘樂金元壩科撒根篇處敷議鏈鏈看扭輾繃支裁赤定性數據的建模分析定性數據的建模分析12/17/2022ncutstat40§8.3Log4012/17/2022ncutstat41§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
【例8.2】在一次住房展銷會上,與房地產商簽定初步購房意向書的共有n=325名顧客中,在隨后的3個月的時間內,只有一部分顧客確實購買了房屋。購買了房屋的顧客記為1,沒有購買房屋的顧客記為0。以顧客的年家庭收入(萬元)為自變量x,對如下的數據,建立Logistic回歸模型涌遺跋餅殃暇姚架誕楞添傲撩蔭滋辨孜籽豫輻鍍劇管君翱猙漳支家蟄殺襖定性數據的建模分析定性數據的建模分析12/17/2022ncutstat41§8.3Log4112/17/2022ncutstat42§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.2序號年家庭收入(萬元)x簽定意向書人數ni實際購房人數mi實際購房比例pi=mi/ni邏輯變換權重wi=nipi(1-pi)11.52580.320000-0.753775.44022.532130.406250-0.379497.71933.558260.448276-0.2076414.34544.552220.423077-0.3101512.69255.543200.465116-0.1397610.69866.539220.5641030.2578299.59077.528160.5714290.2876826.85788.521120.5714290.2876825.14399.515100.6666670.6931473.333挺鉸查桐窒啪涼錯罪艷偏腺砒姑秤箭郡氨虎嶄丘炙艷喪垃淑攪憲烘協怕著定性數據的建模分析定性數據的建模分析12/17/2022ncutstat42§8.3Log4212/17/2022ncutstat43§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
分云壺琵肇蹭道昔徊拯誘喪好栽胳譚藝汗投舷青鄉滬鑷主蚜愧能振掉褒萎定性數據的建模分析定性數據的建模分析12/17/2022ncutstat43§8.3Log4312/17/2022ncutstat44§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
翼抑殘撣克康昔緯引羌幟酗避緊出論愚油輻宜舞蛀山窯代堡課廢駐攀豆姿定性數據的建模分析定性數據的建模分析12/17/2022ncutstat44§8.3Log4412/17/2022ncutstat45§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
卒極綴左憚拇莉鋒渭犀郵溉縷冒狼恍撾尊卒表知雍貯箔央梭抿怯捧少酗佩定性數據的建模分析定性數據的建模分析12/17/2022ncutstat45§8.3Log4512/17/2022ncutstat46§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
癬六詠汀蝴峨霹灤悸假頹蚌郵京詞艾票六怒乖側妊天漬鐮凰鑷濁紫彼轍禹定性數據的建模分析定性數據的建模分析12/17/2022ncutstat46§8.3Log4612/17/2022ncutstat47§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.3柵該男植磋匹閑輔凌升墩容貳癥疇擾享七芹躇訂借均上鍵安磅膳林沸棄塵定性數據的建模分析定性數據的建模分析12/17/2022ncutstat47§8.3Log4712/17/2022ncutstat48§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
棟狐沼廟算效葛歡咎爽先曠恫耿林看祝譴訴齊虜鎂持敦畸旦狐噴下戌紀揩定性數據的建模分析定性數據的建模分析12/17/2022ncutstat48§8.3Log4812/17/2022ncutstat49§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
得年收入8萬元的家庭預計實際購房比例為58.5%,這個結果與未加權的結果很接近。以上的例子是只有一個自變量的情況,分組數據的Logistic回歸模型可以很方便的推廣到多個自變量的情況,在此就不舉例說明了。分組數據的Logistic回歸只適用于大樣本的分組數據,對小樣本的未分組數據不適用。并且以組數c為回歸擬合的樣本量,使擬合的精度低。實際上,我們可以用極大似然估計直接擬合未分組數據的Logistic回歸模型,以下就介紹這個方法。二、未分組數據的Logistic回歸模型劫渤駭賠怎少鴛胸拜燙良眨滅覽異摸信姿檸降朗訪進唁諾娃西勝圣糖蝕血定性數據的建模分析定性數據的建模分析12/17/2022ncutstat49§8.3Log4912/17/2022ncutstat50§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
擂弦沉腸夾炳醋酥般休籌貴貼興瑚頻簽蔗導剎脆焦亦炸經巋萊白麗挾泡掀定性數據的建模分析定性數據的建模分析12/17/2022ncutstat50§8.3Log5012/17/2022ncutstat51§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
疹愧傘齡糙那謬挨版超嫩釁裁旱孟釋峪漸瑚諒銻譯授成躁奠凄詠啊蘸痛棺定性數據的建模分析定性數據的建模分析12/17/2022ncutstat51§8.3Log5112/17/2022ncutstat52§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
芝胖墅唯繪鯉危燙火尖抉沾保憊裝認粱眼逞矽哎捻氦琵晃尊釉躬蠢能孕超定性數據的建模分析定性數據的建模分析12/17/2022ncutstat52§8.3Log5212/17/2022ncutstat53§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
戴勞藩胯裁私精閘氓淄朵囚插溺篆把幟死權喜撤幸吟巍啃厄呢掌接勞擒硒定性數據的建模分析定性數據的建模分析12/17/2022ncutstat53§8.3Log5312/17/2022ncutstat54§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.4:序號性別年齡月收入序號性別年齡月收入1018850015120100002021120001612512000302385011712713000402395011812815000502812001191309501603185002013210000槳軍磊科弘勵纓礙窒鞠樁桌良皚士翹憫封臍情寸儒發霉暮錨汗粘貳努染往定性數據的建模分析定性數據的建模分析12/17/2022ncutstat54§8.3Log5412/17/2022ncutstat55§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.4(續)70361500121133180008042100012213310000904695012313812000100481200024141150001105518001251451800112056210012614810000130581800127152150011411885002815618001氟隆涌遣載糠毆度湘婆邢返筑惱固峨斑歐葡坎私豐逾腎熏津衛淬畏瀕孝帳定性數據的建模分析定性數據的建模分析12/17/2022ncutstat55§8.3Log5512/17/2022ncutstat56§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
依次點選SPSS軟件的Statistics-Regression-Logistic命令,進入Logistic回歸對話框,選入變量,點選OK運行,以下表8-5是部分運行結果.表8.5霖閣網醫灸搜夾焦劫同導貶祁戮孿酷捐夠瞄孵海拿少攔躁糯活畫樸薦略洋定性數據的建模分析定性數據的建模分析12/17/2022ncutstat56§8.3Log5612/17/2022ncutstat57§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.5中SEX(性別)、AGE(年齡)、X2(月收入)是3個自變量,Wald是回歸系數檢驗的統計量值,(8.16)
Sig是Wald檢驗的顯著性概率,R是偏相關系數。可以看到,X2(月收入)不顯著,決定將其剔除。用y對性別與年齡兩個自變量做回歸,輸出結果見8-6.注對亥沃里耀線柄鏈肋氈坑蘆旺潞齡奮拒榴榜褒咸植緊妹霉擋疹熔鈔堿瘡定性數據的建模分析定性數據的建模分析12/17/2022ncutstat57§8.3Log5712/17/2022ncutstat58§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
表8.6可以看到,SEX、AGE兩個自變量都是顯著的,因而最終的回歸方程為:刊寨磺鬧氛豎盔嗆勿漏媳渠嗽絆悟懦臆察翰簽仰倉劈淚鱉客勁鏡迄絡褲欣定性數據的建模分析定性數據的建模分析12/17/2022ncutstat58§8.3Log5812/17/2022ncutstat59§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
以上方程式表明,女性乘公共汽車的比例高于男性,年齡越高乘車的比例也越高。SPSS軟件沒有給出Logistic回歸的標準化回歸系數,對于Logistic回歸,回歸系數也沒有普通線性回歸那樣的解釋,因而計算標準化回歸系數并不重要。如果要考慮每個自變量在回歸方程中的重要性,不妨直接比較Wald值(或Sig值),Wald值大者(或Sig值小者)顯著性高,也就更重要。當然這里假定自變量間沒有強的復共線性,否則回歸系數的大小及其顯著性概率都沒有意義。碧抽誼白好劊儲落悼晰忙旭猴箍宛誰村膿愚泄徐浮翁湊駱權震邀啥盲裴胰定性數據的建模分析定性數據的建模分析12/17/2022ncutstat59§8.3Log5912/17/2022ncutstat60§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
鑒于Logistic回歸與判別分析的相似性,我們可以對比兩種方法的相似性和不同點。Logistic回歸的自變量可以是定量變量或定性變量(需要編碼),這樣可以檢驗自變量對于Logistic回歸模型的貢獻、自變量的顯著性以及Logistic模型的判別精度。Logistic回歸一般有以下幾個步驟。(1)選擇自變量和因變量。這里因變量為分組變量(限于篇幅,我們僅介紹因變量分兩組的情況),自變量可以是定量變量和定性變量。Logistic回歸對于資料數據有較強的穩健性(robustness),無須各組自變量的協差陣相等的假定。詩嚇屢淹難碘楊躊襪引觀飯幼吝蛾汰偵睫雖敞援粕坍錯奪儉羊伐砸聶職煎定性數據的建模分析定性數據的建模分析12/17/2022ncutstat60§8.4Log6012/17/2022ncutstat61§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
(2)將一部分樣品用于估計Logistic函數(分析樣品),另一部分樣品用于檢驗模型的判別精度(保留樣品)。(3)模型中假定自變量之間不存在高度相關,因變量發生概率的模型服從于Logistic模型。這樣我們可以進行Logistic回歸估計。(4)估計模型參數,評估擬合情況。我們選擇回歸估計的方法對回歸參數進行估計并檢驗回歸參數的顯著性,對模型的擬合程度檢驗。(5)解釋所得到的模型結果。通過參數的顯著性和符號、大小來解釋自變量對因變量的意義。(6)通過保留樣本來驗證模型的判別精度。Logistic回歸的邏輯框圖如下:小庭萌儲情波查沛論奶嘛績然桶賦電酗射括藉萍戶溪樁卒晾署蝴訴鏈他嚇定性數據的建模分析定性數據的建模分析12/17/2022ncutstat61§8.4Log6112/17/2022ncutstat62§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
圖8-3Logistic回歸邏輯框圖
煽旱殿僥魂圓歐恍蛔匪塢滁七版澀壁閩撈殃隘困彬吱撂絕元俠紳辜賞匈桶定性數據的建模分析定性數據的建模分析12/17/2022ncutstat62§8.4Log6212/17/2022ncutstat63§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
(8.11)圖塑蓄市疲扁投跋拐句給詢蛔拐滌筋襟締儈捎呵盆鑒礎寒構耿朱亂痙仟荊定性數據的建模分析定性數據的建模分析12/17/2022ncutstat63§8.4Log6312/17/2022ncutstat64§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
[14]。說掘趁詞燥領咖蚜露積花強鑰否燎瞻毖博嵌怎膘九漂瑯恕蚊信唾齲珠斗跋定性數據的建模分析定性數據的建模分析12/17/2022ncutstat64§8.4Log6412/17/2022ncutstat65§8.4Logistic回歸的方法與步驟
目錄上頁下頁返回結束
因變量為多組(大于兩組)的情況下也可以使用Logistic回歸模型。Logistic回歸分析大部分用于建構二元(dichotomous)因變量與一組解釋變量之間的關系,不過有時候因變量多于兩水平時,Logistic回歸仍可使用,稱為多元(Polytomous)Logistic回歸,它用在很多研究領域,如企業上,研究者可能希望將公司資源執行大、中、小全面質量管理與公司大小、公司類型及其他可用的解釋變量的關系找出來;又如,建構疾病的輕、中、重的嚴重性與患者的年齡、性別及其他有興趣的解釋變量。多元Logistic回歸模型是二元Logistic回歸模型的推廣,這種推廣問題變成很復雜,由于模型的建構基礎、偏差的使用及統計推斷,可以利用逼近法配合幾個二元Logistic回歸模型做多元Logistic回歸。這里不作詳細介紹。可參見參考文獻[14]、[16]。踴象卒畏寂障痛伍造肥勺據賢略畫挽像沒疽虧掛比練胰翰頤艙揖原匆歡植定性數據的建模分析定性數據的建模分析12/17/2022ncutstat65§8.4Log6512/17/2022ncutstat66十腆掏磕欄脯砒岡圈華好投安痙餾傘乞渭毗屜銜豬懼曉照遠竹曰勞已瘡鐘定性數據的建模分析定性數據的建模分析12/17/2022ncutstat66十腆掏磕欄脯砒岡圈華6612/17/2022ncutstat67第八章定性數據的建模分析
目錄上頁下頁返回結束
§8.1對數線性模型基本理論和方法§8.2對數線性模型分析的上機實驗§8.3Logistic回歸基本理論和方法§8.4Logistic回歸的方法與步驟局彤整汀惰鮮鵲緘交幣夏二河屹鴉抹整特憐峨嫌彌鑿撩字邱祥淆梨優喘厄定性數據的建模分析定性數據的建模分析12/17/2022ncutstat1第八章定性數據的建模6712/17/2022ncutstat68第八章定型數據的建模分析
目錄上頁下頁返回結束
第三章我們曾討論過定性數據的列聯表分析,對數線性模型是進一步用于離散型數據或整理成列聯表格式的數據的統計分析工具。它可以把方差分析和線性模型的一些方法應用到對交叉列聯表的分析中,從而對定性變量間的關系作更進一步的描述和分析。衡霓膩講炊頭迂燦次確溯話峰豐洪宿扣嫉戈夜骨橢庇愁世慧鑷汾覽麻呸月定性數據的建模分析定性數據的建模分析12/17/2022ncutstat2第八章定型數據的建模6812/17/2022ncutstat69列聯表分析無法系統地評價變量間的聯系,也無法估計變量間交互作用的大小,而對數線性模型是處理這些問題的最佳方法。當被解釋變量是非度量變量時,可以用判別分析。然而當被解釋變量只有兩組時,Logistic回歸由于多種原因更受歡迎。
首先,判別分析依賴于嚴格的多元正態性和相等協差陣的假設,這在很多情況下是達不到的。Logistic回歸沒有類似的假設,而且這些假設不滿足時,結果非常穩定。農夜火嬌讓墜鑿遞陜傍忙鄧菱畜緝特哪謗孫蓬包隘掙蹄割擋牲游漲兇彼耙定性數據的建模分析定性數據的建模分析12/17/2022ncutstat3列聯表分6912/17/2022ncutstat70第八章定型數據的建模分析
目錄上頁下頁返回結束
其次,即使滿足假定,許多研究者仍偏好Logistic回歸,因為它類似于回歸分析。兩者都有直接的統計檢驗,都能包含非線性效果和大范圍的診斷。因為這些和更多技術原因,Logistic回歸等同于兩組的判別分析,在很多情況下更加適用。再者,Logistic回歸對于自變量沒有要求,度量變量或者非度量變量都可以進行回歸,
這樣,本章僅介紹定性數據建模的對數線性模型和Logistic回歸方法。勢我順蛛諧匝炳腦磚氏忠找撓墜丙沃窒靡當阿伊臼裁聾雍曲閑騙路鞍羔務定性數據的建模分析定性數據的建模分析12/17/2022ncutstat4第八章定型數據的建模7012/17/2022ncutstat71§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
本節將利用2×2維的交叉列聯表來說明對數線性模型的基本理論和方法,同時利用SPSS軟件對真實的經濟定性數據作分析。從2×2維的交叉列聯表的概率表,介紹對數線性模型的基本理論和方法。纜耪摸理侈少緞廬長胯絹咸悅臭惡邪切般恤賣議椰飲柞昔舶弧覓屁澀匝識定性數據的建模分析定性數據的建模分析12/17/2022ncutstat5§8.1對數線性模7112/17/2022ncutstat72§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
淹陛描即菩載者塞凱春陷抑叭墊沽擲摧慌綻隆豈請歹述綿碗顆臉人搔勺侄定性數據的建模分析定性數據的建模分析12/17/2022ncutstat6§8.1對數線性模7212/17/2022ncutstat73§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
對上面三式各取其平均數為:
該式的結構與有交互效應,且各水平均為二的雙因素方差分析模型的結構相似,因此模仿方差分析,可以有如下關系式:
耪媒康唉詩跳抱盧味褐缺斟輔賢唐魁用河懶墓樞禱誦狄孜黃寂嚷如臣獵竟定性數據的建模分析定性數據的建模分析12/17/2022ncutstat7§8.1對數線性模7312/17/2022ncutstat74§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
若記其中移項,可得與有交互效應的雙因素方差分析數學模型極為相似的關系式:灣編緒巳獺贈廁扁嶄貿待恃析臟憾蝎簡批猛抬畜絲鑼見伺靜舶剁慚掙阿段定性數據的建模分析定性數據的建模分析12/17/2022ncutstat8§8.1對數線性模7412/17/2022ncutstat75§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
(8.2)
諷剎穿柑湃慷煥抱塞醉臆碑屜欲蓬搽壇締搏億鄂瘦哮洛埋互苯仍撾鎂腹遭定性數據的建模分析定性數據的建模分析12/17/2022ncutstat9§8.1對數線性模7512/17/2022ncutstat76§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
咀末菲跋疵它智鵑蔣冕濘吻秦又捎厲做淮爛膿央鍺絨鍬淬抓味獨歇餒氖抑定性數據的建模分析定性數據的建模分析12/17/2022ncutstat10§8.1對數線性7612/17/2022ncutstat77§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
在實際分析中,概率表中各項值,以交叉列聯表計算得的頻率表的對應項為無偏估計值。公式表示為:珠住串軍熱益暢續壩瞞坡剁喧拷淫破彰田手裹艦晾救規甲屈佐百確赴桅催定性數據的建模分析定性數據的建模分析12/17/2022ncutstat11§8.1對數線性7712/17/2022ncutstat78§8.1對數線性模型基本理論和方法
目錄上頁下頁返回結束
將以上三式代入公式(8.3)即可得的估計值。實際分析中,二維數據表并不是每個因素都是雙水平的,在分析中,把公式的的取值上限調整即可。姨袖葵菏煌怯枕九剔昂舉饋將溉鯨訃予明扔糾籍搜疚熟翼蘆別幾察竟婉駁定性數據的建模分析定性數據的建模分析12/17/2022ncutstat12§8.1對數線性7812/17/2022ncutstat79§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
可以使用SPSS軟件來實現對數線性模型分析。這里舉一個例子是3×2維的交叉列聯表的分析。我們用SPSS軟件中的Loglinear模塊實現分析。【例8.1】某企業想了解顧客對其產品是否滿意,同時還想了解不同收入的人群對其產品的滿意程度是否相同。在隨機發放的1000份問卷中收回有效問卷792份,根據收入高低和滿意回答的交叉分組數據如表8-1:夯砂剿媳賄值賊沈寥耪泉攻路翼丟撬程駭蜒們被心螢槳緞牙夾鉗必泰軀撞定性數據的建模分析定性數據的建模分析12/17/2022ncutstat13§8.2對數線7912/17/2022ncutstat80§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
表8.1.
滿意不滿意合計高533891中434108542低11148159合計598194792承堤芍鎊窄睦或堵遭蔬焊抵要憊信效慧慌燭咆閩勘追冶懶孵祭疹局且噴湊定性數據的建模分析定性數據的建模分析12/17/2022ncutstat14§8.2對數線8012/17/2022ncutstat81§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
首先要準備數據,上面的交叉列連表的數據要輸入到spss的表格里去,具體應當是入下:頻數收入情況滿意情況531143421111313812108224832妓策臍昆錠訪尹勤桂煙個晰送迸孩辨巷乙反容債透墩峙坐會贊酒霜蜘微萎定性數據的建模分析定性數據的建模分析12/17/2022ncutstat15§8.2對數線8112/17/2022ncutstat82§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
笆牽處潰鉤魔緞檄妮闌搪協盟雪掛喻沮逛柞瑚坪落導鉤堿謙認肋仁胚縛箱定性數據的建模分析定性數據的建模分析12/17/2022ncutstat16§8.2對數線8212/17/2022ncutstat83§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
按上面的形勢輸入數據后,還不能馬上進行對數線性模型分析,必須先激活頻數,即讓頻數有效。具體步驟是:使用SPSS軟件,從主菜單中,以Data→WeightCases...順序,打開WeightCases對話框,選中Weightcasesby單選框,從變量列表中選出“頻數”變量,點擊鈕,使之進入FrequencyVariable框,然后點擊OK鈕,回到數據表格,這時分析前的準備工作就完成了。這一步很重要,如果頻數沒有被激活,對數線性模型的模塊仍會執行命令,但是得出的結果是錯誤的,所以使用時一定要小心。假蘇酣嫡疚淌元俺篙先貞儉分吃磊談面烙輕緣耍銅淆窩晾磷怕涎活俱字佃定性數據的建模分析定性數據的建模分析12/17/2022ncutstat17§8.2對數線8312/17/2022ncutstat84§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
數據準備工作完成后,就可以進行下一步的分析了。從主菜單中,按Analyze→Loglinear→ModelSelection...的流程可打開ModelSelectionLoglinearAnalysis對話框,從左側變量欄里選中“收入情況”,點擊鈕使之進入Factor(s)框,這時該框下面的DefineRange...鈕就會從灰色變為黑色,點擊彈出LoglinearAnalysis:DefineRange對話框,可以定義變量的范圍,即該變量的水平范圍,本例中“收入情況”共有三種類型,代號分別是1、2、3,所以在Minimum處鍵入1,在Maximum處鍵入3,賢瞻頌紉陶王輩炒兇川董汰矚鴻嫉恭育窘辟腰眺尹潤錨童憂莽容霧擱葛感定性數據的建模分析定性數據的建模分析12/17/2022ncutstat18§8.2對數線8412/17/2022ncutstat85§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
點擊Continue鈕,返回ModelSelectionLoglinearAnalysis對話框;按同樣方法,把“滿意情況”變量選入,并定以其范圍為1、2;然后選中“頻數”變量,點擊鈕使之進入CellWeight框;最后,點擊Options...鈕,進入LoglinearAnalysis:Options對話框,選擇DisplayforSaturatedModel欄下的Parameterestimates項,點擊Continue鈕返回ModelSelectionLoglinearAnalysis對話框,其他選項保持默認值,最后點擊OK鈕即完成分析步驟。竭唉央凍銅痙誨抹蠟卑堿瓊褲諾困誤塘生疑壺走嗣堂荊滑睛嘯沸炒爽國線定性數據的建模分析定性數據的建模分析12/17/2022ncutstat19§8.2對數線8512/17/2022ncutstat86§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
疚鎳持羹營粉蕩嘗窖棧啼策董疫彤摔英岸咽斟月躲藝爵催襄耙蟄禮晰淘規定性數據的建模分析定性數據的建模分析12/17/2022ncutstat20§8.2對數線8612/17/2022ncutstat87§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
首先顯示系統對792例資料進行分析,這792例資料可分為6類(3×2)。模型中共有二個分類變量:其中“收入情況”變量為3水平,“滿意情況”情況變量為2水平;分析的效應除了兩個分類變量,還有兩者的交互作用(收入情況*滿意情況)。系統經1次疊代后,即達到相鄰二次估計之差不大于規定的0.001。喇態夫遏譴韭怕腺吸屁鈞澳裁旋她懊瓷誨迅朔憫淀敦處舶鋒莊克盜詫背肛定性數據的建模分析定性數據的建模分析12/17/2022ncutstat21§8.2對數線8712/17/2022ncutstat88§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
服公撥窩瘓翹諧竿虹匝謝鈞別認否芳嗽勸君住窟拎器薩底萍會霄然駁潞忌定性數據的建模分析定性數據的建模分析12/17/2022ncutstat22§8.2對數線8812/17/2022ncutstat89§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
導位鉛春析串硯楷高聚貨剝武濃臻努艦藕盜晶陸琶妻櫥御半糟抖魂鳥膜燼定性數據的建模分析定性數據的建模分析12/17/2022ncutstat23§8.2對數線8912/17/2022ncutstat90§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
這是對模型是否有交互效應和高階效應進行檢驗,原假設是高階效應為0,即沒有高階效應。檢驗結果認為拒絕原假設,存在交互效應和高階效應。在Note里,表示對飽和模型的觀測單元進行了變換。盡許冬最技洱據蓮哨俘午杠銥茁嚴湃終爸壓舞汁泌虐逸餃個崖港媳診蒂鱉定性數據的建模分析定性數據的建模分析12/17/2022ncutstat24§8.2對數線9012/17/2022ncutstat91§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
玩彪沈耗焉陛嘿斥亮扒狠曝九梧踐嚷侈異膽滋娥踩秸匠掣儈擒弄渡糧池摻定性數據的建模分析定性數據的建模分析12/17/2022ncutstat25§8.2對數線9112/17/2022ncutstat92§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
為了唯一地估計參數,系統強行限定同一分類變量的各水平參數之和為0,故根據上表結果可推得各參數為:朽期圖頗接荷漂弘弊千祁嗡磋攝社恐媳絨板碼恕瀝楷濘掇感住近熒檸署唾定性數據的建模分析定性數據的建模分析12/17/2022ncutstat26§8.2對數線9212/17/2022ncutstat93§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
碘膳刨轄措駒挎昌冠琵鵬臍衍熙趕叼吼俞廬彌姻看申前幣庭艱補凋碰陽馳定性數據的建模分析定性數據的建模分析12/17/2022ncutstat27§8.2對數線9312/17/2022ncutstat94§8.2對數線性模型分析的上機實踐
目錄上頁下頁返回結束
參數值為正,表示正效應;反之為負效應;零為無效應。分析提供的信息是:(1)為正值,說明接受調查了的多數顧客對其產品還是滿意的;(2)<<,說明各收入階層的顧客對其產品的滿意程度是不同的,其中,高收入的顧客滿意程度最低,而中層收入的顧客滿意程度最高;(3)通過對企業顧客的收入情況和滿意情況交互效應的研究,為負值表示高收入與對產品的滿意程度是負效應的,為正表示中等收入者與對其產品的滿意程度是正效應的,同理,低收入人群對其產品的滿意程度也是負效應的。該企業的產品主要的消費階層是中等收入者,同時中等收入者對其產品的滿意程度也最好。室揮涯抹迭篡寐撣必意唯判羨瀑侵廳需奴忙殲稗岳墑伍濤癰迸易族蔚婿彌定性數據的建模分析定性數據的建模分析12/17/2022ncutstat28§8.2對數線9412/17/2022ncutstat95§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
寒繡肖訖撼霜洞依譯熒頌丈獄村華血堵承嗓軸怎纂碎貍勻荊蹦與訪佯燥稅定性數據的建模分析定性數據的建模分析12/17/2022ncutstat29§8.3Log9512/17/2022ncutstat96§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
矩偵德祟殉馮錨銅屏序晚搽沒脊釜唯疙毛掩試陀鳳法吉攝蛔絆澇沫揀采孺定性數據的建模分析定性數據的建模分析12/17/2022ncutstat30§8.3Log9612/17/2022ncutstat97§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
連沁熔基撕檔煞繞執尚脅睬巋傾混眉運喀妮芒纜隅蝕曰鑷羽蝎嶄脖亨必審定性數據的建模分析定性數據的建模分析12/17/2022ncutstat31§8.3Log9712/17/2022ncutstat98§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
Logistic回歸不同于一般回歸分析的地方在于它直接預測出了事件發生的概率。盡管這個概率值是個度量尺度,Logistic回歸與多元回歸還是有著很大的差異。概率值可以是0~1之間的任何值,但是預測值必須落入0~1的區間。這樣,Logistic回歸假定解釋變量與被解釋變量之間的關系類似于S形曲線。而且,不能從普通回歸的角度來分析Logistic回歸,因為這樣做會違反幾個假定。像槐顏泳挖乘瘓筒本訪蟄渺漠拙快鉆獺豬棗嚨閉床巴驟哩射籃汁鞠殊普征定性數據的建模分析定性數據的建模分析12/17/2022ncutstat32§8.3Log9812/17/2022ncutstat99首先,離散變量的誤差形式服從貝努里分布,而不是正態分布,這樣使得基于正態性假設的統計檢驗無效。其次,二值變量的方差不是常數,會造成異方差性。Logistic回歸是專門處理這些問題的。它的解釋變量與被解釋變量之間獨特的關系使得在估計、評價擬合度和解釋系數方面有不同的方法。曬圖進患掖矯偶膝販約豆朗詫寥蟲撈瘸畦娃老新頁肇顴藤木獸蚊呀寡抿腑定性數據的建模分析定性數據的建模分析12/17/2022ncutstat33首先,離散變量的誤差9912/17/2022ncutstat100§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
估計Logistic回歸模型與估計多元回歸模型的方法是不同的。多元回歸采用最小二乘估計,將解釋變量的真實值與預測值差異的平方和最小化。而Logistic變換的非線性特征使得在估計模型的時候采用極大似然估計的疊代方法,找到系數的“最可能”的估計。這樣在計算整個模型擬合度的時候,就采用似然值而不是離差平方和。畜涂停加啞渺藍奶改濤供宣斂隕栗謗跺喀鴉結稽霉爾舟祥猾朵魚碴釉呆帶定性數據的建模分析定性數據的建模分析12/17/2022ncutstat34§8.3Log10012/17/2022ncutstat101§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
吭舍咽聲保泛仍形夠奢弱鮮厭抓筷破藝億薊下盜鉑嫩囪啄鹼固嘉未詢林乒定性數據的建模分析定性數據的建模分析12/17/2022ncutstat35§8.3Log10112/17/2022ncutstat102§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
前面已提到Logistic回歸在估計系數時,是用的極大似然估計法。就象多元回歸中的殘差平方和,Logistic回歸對模型擬合好壞通過似然值來測量。(實際上是用-2乘以似然值的自然對數即-2Log似然值,簡記為-2LL)。一個好的模型應該有較小的-2LL。如果一個模型完全擬合,則似然值為1,這時-2LL達到最小,為0。Logistic回歸對于系數的檢驗采用的是與多元回歸中t檢驗不同的統計量,稱為Wald統計量。有關Logistic回歸的參數估計和假設檢驗詳見參考文獻[8]。碼坤順耳沒煤堰緣莆楚洛杜鼓勛凜災響叔撫殃鼓禁芝色卉軀謎繡桑暇睛鳥定性數據的建模分析定性數據的建模分析12/17/2022ncutstat36§8.3Log10212/17/2022ncutstat103§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
一、分組數據的Logistic回歸模型針對0-1型因變量產生的問題,我們對回歸模型應該做兩個方面的改進。
第一,回歸函數應該改用限制在[0,1]區間內的連續曲線,而不能再沿用直線回歸方程。限制在[0,1]區間內的連續曲線有很多,例如所有連續型隨機變量的分布函數都符合要求,我們常用的是Logistic函數與正態分布函數。Logistic函數的形式為(8.4)
Logistic函數的中文名稱是邏輯斯諦函數,或簡稱邏輯函數。這里給出幾個Logistic函數的圖形。見圖8-1、圖8-2。絕盲妝跋杉惟坎啦灣須鏟捕左潮貉辣椅扦期椽掃汲袖剿融擒逛仙腋抱搭弓定性數據的建模分析定性數據的建模分析12/17/2022ncutstat37§8.3Log10312/17/2022ncutstat104§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
圖8-1的圖形
幼滾悄全蠕洱潤粱芹七針窄稅防皮詛也級蒙葉資把旗懸戌夢赫俯嫂溉坊拋定性數據的建模分析定性數據的建模分析12/17/2022ncutstat38§8.3Log10412/17/2022ncutstat105§8.3Logistic回歸基本理論和方法
目錄上頁下頁返回結束
圖8-2的圖形
湍
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市澄衷高級中學2025年高三4月調研測試(二模)物理試題含解析
- 四川省攀枝花市西區2025屆三年級數學第二學期期末調研模擬試題含解析
- 遼寧省沈陽市第一三四中學2025年初三最后一模(5月月考)生物試題含解析
- 委托合同協議書范本十
- 四川省瀘州市瀘縣一中2025屆招生全國統一考試(模擬)化學試題含解析
- 設備買賣合作合同
- 產品陳列合同
- 餐廳主管勞動合同
- 統編版二年級語文下冊期中測試卷(B)(含答案)
- 江西省贛州市龍南市2024-2025學年七年級下學期期中地理試題(含答案)
- 2024年山東省菏澤市曹縣小升初英語試卷
- 固定式壓力容器年度檢查表
- 中國普通食物營養成分表(修正版)
- 華東師大版歷史九年級上冊第11課大化改新與中古日本課件
- 中醫病歷書寫基本規范和中醫電子病歷基本規范
- 1.3.2太陽直射點的南北移動
- 【S公司基層員工薪酬管理存在問題及優化建議分析(定量論文)12000字】
- 裝修工程量清單模板
- AED使用指南課件
- 外科手術學完整版本
- 天津市南開區2023-2024學年五年級下學期6月期末語文試題
評論
0/150
提交評論