[理學]變量間的關系.ppt_第1頁
[理學]變量間的關系.ppt_第2頁
[理學]變量間的關系.ppt_第3頁
[理學]變量間的關系.ppt_第4頁
[理學]變量間的關系.ppt_第5頁
已閱讀5頁,還剩36頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

變量間關系,引例,引例1:禿頭與政治 有西方專家研究發現,前蘇聯最高首腦頭發多少居然與他們的政治風格有關,禿頭的激進,頭發濃密的保守,而且激進和保守交替出現:列寧禿頭,激進;斯大林發多,保守;赫魯曉夫禿頭,激進;勃列日涅夫發多,保守;安德羅波夫禿頭,激進;契爾年科夫發多,保守;戈爾巴喬夫禿頭,激進 葉利欽雖然發多,卻最激進,但他不屬于前蘇聯,引例2:“裙擺定律” 泰勒就提出了著裝與經濟狀況關系的“裙邊理論” 女士的裙子長短是經濟狀況的一個指示器 在經濟繁榮的年代,女士能夠穿得起并顯露昂貴的絲襪鞋子,裙邊自然上移; 到了經濟蕭條的年月,勤儉持家成為一種基本要求,絲襪鞋子自然沒有那么漂亮了,于是裙邊要往下放一下 有人驗之以美國年代經濟上升時期及年代大蕭條時期的服裝市場,還真證實了裙子長度與經濟狀況的這種反比關系,引例3:有名字的奶牛產奶量更高 英國紐卡斯爾的科學家,凱瑟琳道格拉斯博士和皮特羅林森博士表示,給奶牛起名字,并像對待人一樣去對待奶牛,這樣牛也高興了,放松了,產奶量也上去了,可以為每個奶牛場提高500品脫的年產量,引例4:鸛鳥送子 歐洲,人們把一種鳥稱為送子鳥 相傳,送子鳥落到誰家屋頂造巢,誰家就會喜得貴子,幸福美滿。因此,在歐洲鄉村,你經常能看到住家的屋頂煙囪上搭著一個平臺,那是專為送子鳥準備的,種神奇的送子鳥就是白鸛,函數關系 19世紀末,德國數學家康托創立了集合論,人們把函數的定義提升到抽象的層次:設A,B是非空的集合,f是某一法則,若A中每個元素x,經由法則f,總有集合B中確定的元素y與之對應,則稱f是定義在集合A上的一個函數 圓的面積(S)與半徑之間非關系可表示為S = R2 ; 商品的銷售額(y)與銷售量(x)之間的關系可表示為 y = p x p 為單價,變量間關系,統計(相關)關系 變量間確實存在、但數量上不固定的相互依存。這種關系不能用函數關系精確表達 Fourth Level 商品銷售額(y)與廣告費支出(x)之間的關系 糧食畝產量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關系 收入水平(y)與受教育程度之間的關系(x) 父親身高(y)與子女身高(x)之間的關系 ,變量間關系(續),變量間關系(續),因果關系 科學研究的目的是探討因果關系 周易有言,積善之家必有余慶,積惡之家必有余殃! 包括啟蒙書上也有,善惡終有報,不是不報,時辰未到 牛頓也說過它可以用他的力學規律描述任何物體的任何運動,都是確定的,所以牛頓理論是確定論,其因果律是確定的因果律,因果一一對應,不可倒置; 量子力學中位置和動量不可以同時被確定的,但是其中之一是可以被精確地確定的,對于單個微觀粒子無法判斷其真實位置,但是服從統計規律,所以量子力學的因果律是統計規律的因果律,變量間關系(續),證明因果關系三要素: 存在相關關系 兩個變量統計相關A 引起了 B的變化 存在適當的時間順序 自變量在因變量之前發生 排除其他可能的原因 B 不是由 A之外的其他原因引起 思考:冰淇淋消費量與車禍中兒童受傷數偽相關,變量間關系(續),關于變量間關系的四個問題 從數據來看,變量間有關系嗎? 如果有關系,關系有多強? 是偶然的嗎? 是因果關系嗎? 思考:如何看待吸煙與健康的關系?,變量間關系(續),例子:性別與工作偏好,預測 自變量與因變量 Y與X:兩條腿比一條腿有勁 閃電和打雷 爆米花銷售和垃圾袋使用 發電量和熱天數 廣告時間和用水量 ,變量間關系(續),不同類型變量的關系 思考:引例中分別屬于?,變量間關系(續),列聯表(contingency table) 由兩個以上的變量交叉分類的頻數分布表 行變量的類別用 r 表示, ri 表示第 i 個類別 列變量的類別用 c 表示, cj 表示第 j 個類別 每種組合的觀察頻數用 fij 表示 表中列出了行變量和列變量的所有可能的組合,所以稱為列聯表 一個 r 行 c 列的列聯表稱為 r c 列聯表,分類變量間的關系,列聯表(contingency table) 由兩個以上的變量交叉分類的頻數分布表 行變量的類別用 r 表示, ri 表示第 i 個類別 列變量的類別用 c 表示, cj 表示第 j 個類別 每種組合的觀察頻數用 fij 表示 表中列出了行變量和列變量的所有可能的組合,所以稱為列聯表 一個 r 行 c 列的列聯表稱為 r c 列聯表,分類變量間的關系(續),二維列聯表,列(cj),行(ri),fij 表示第 i 行第 j 列的觀察頻數,分類變量間的關系(續),三維列聯表,分類變量間的關系(續),分類變量間的關系(續),例析 廣告公司想要了解觀眾的所得收入與電視節目收視是否相關,其零假設為: H0: 電視節目的選擇與收入無關 H1: 收入與選擇電視節目有關 該公司抽取500戶為樣本,先用收入將樣本區分成高、中、低三類,再以收看電視的種類分成運動、電影、新聞三類,所得資料列聯表,分類變量間的關系(續),分類變量間的關系(續),圖示法,250*250/500=125,150*50/500=15,分類變量間的關系(續),Critical value = 9.49,數值法:有沒有關系?,分類變量間的關系(續),分類變量間的關系(續),相關的強度 主要是對分類(也可對順序數據)之間相關程度的測度 列聯表相關測量的統計量主要有 相關系數 列聯相關系數 V 相關系數,分類變量間的關系(續), 相關系數(correlation coefficient) 測度22列聯表中數據相關程度 對于22 列聯表, 系數的值在01之間 相關系數計算公式為,分類變量間的關系(續),思路:簡化的 22 列聯表為例,分類變量間的關系(續),列聯表中每個單元格的期望頻數分別為 將各期望頻數代入 的計算公式得,分類變量間的關系(續),將入 相關系數的計算公式得 若ad 等于 bc , = 0,表明變量X 與 Y 之間獨立; 若 b=0 ,c=0,或a=0 ,d=0,意味著各觀察頻數全部落在對角線上,此時| =1,表明變量X 與 Y 之間完全相關 列聯表中變量的位置可以互換,的符號沒有實際意義,故取絕對值即可,分類變量間的關系(續),C相關系數(coefficient of contingency) 用于測度大于22列聯表中數據的相關程度 計算公式為 C 的取值范圍是 0C1 C = 0表明列聯表中的兩個變量獨立 C 的數值大小取決于列聯表的行數和列數,并隨行數和列數的增大而增大 根據不同行和列的列聯表計算的列聯系數不便于比較,分類變量間的關系(續),V 相關系數(V correlation coefficient) 計算公式為 V 的取值范圍是 0V1 V = 0表明列聯表中的兩個變量獨立 V=1表明列聯表中的兩個變量完全相關 不同行和列的列聯表計算的列聯系數不便于比較 當列聯表中有一維為2,min(r-1),(c-1)=1,此時V=,分類變量間的關系(續),、C、V 的比較 同一個列聯表,、C、V 的結果會不同 不同的列聯表,、C、V 的結果也不同 在對不同列聯表變量之間的相關程度進行比較時,不同列聯表中的行與行、列與列的個數要相同,并且采用同一種系數,分類變量間的關系(續),用軟件求解:SPSS需原始數據格式,分類變量間的關系(續),列聯分析的一個局限 Simpsons Paradox Association of two variables without the third leads to a specific conclusion. Association of two variables with the third variable leads to the opposite conclusions,分類變量間的關系(續),緣由 順序變量比分類數據信息含量多 父親的教育程度是否與兒女的教育程度 經濟地位與能力高低 社會階層與幸福感 .,順序變量間的關系,順序變量間的關系(續),例:1956年調查,政黨身份與選舉興趣,順序變量間的關系(續),圖示法,順序變量間的關系(續),數值法(Gamma系數),順序變量間的關系(續),將數字作為排序(秩) HDI與人均GDP,順序變量間的關系(續),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論