實驗基本描述統計_第1頁
實驗基本描述統計_第2頁
實驗基本描述統計_第3頁
實驗基本描述統計_第4頁
實驗基本描述統計_第5頁
已閱讀5頁,還剩83頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實驗基本描述統計1第1頁,課件共88頁,創作于2023年2月統計分析軟件的作用統計分析是數據分析的主要工具完整的數據分析過程包括:數據的收集數據的整理數據的分析統計學為數據分析過程提供一套完整的科學的方法論。統計分析軟件為數據分析提供了實現手段。2第2頁,課件共88頁,創作于2023年2月統計軟件的種類很多。有些功能齊全,有些價格便宜;有些容易操作,有些需要更多的實踐才能掌握。還有些是專門的軟件,只處理某一類統計問題。面對太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。統計軟件3第3頁,課件共88頁,創作于2023年2月幾種常用的統計軟件典型的統計軟件SASSPSSMINITABEviewsExcelMINITABSTATISTICAExcelSASSPSS4第4頁,課件共88頁,創作于2023年2月SAS:這是功能非常齊全的軟件;盡管價格相當不菲,許多公司,特別是美國制藥公司,還是因為其功能眾多和某些美國政府機構認可而使用。盡管現在已經盡量“通俗化”,但仍然需要一定的訓練才可以進入。也可以對它編程;但對于基本統計課程則不那么方便。Minitab:這個軟件是很方便的功能強大而又齊全的軟件,在我國用的不如SPSS與SAS那么普遍。Eviews:一個主要處理回歸和時間序列的軟件。采用計量經濟學方法與技術,對社會經濟關系與經濟活動的數量規律進行“觀察”,是一個得到普遍使用計量經濟學軟件包。5第5頁,課件共88頁,創作于2023年2月S-PlusS語言(AT&T貝爾實驗室)的后續發展極為強大的統計功能和繪圖能力應用上以理論研究、統計建模為主需要有較好的數理統計背景對編程能力要求極高Excel凡有MicrosoftOffice的計算機,基本上都裝有Excel。但要注意,必須裝數據分析的功能。隨著問題的深入,Excel需要使用函數。專門一些的統計推斷問題還需要其他專門的統計軟件來處理。6第6頁,課件共88頁,創作于2023年2月SPSS:很受歡迎;容易操作,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經“通俗化”。對于非專業統計工作者是很好的選擇。7第7頁,課件共88頁,創作于2023年2月SPSS軟件最初全稱為“社會科學統計軟件包”(StatisticalPackageforthesocialScience);隨著SPSS產品服務領域的擴大和服務深度的增加,SPSS公司于2000年正式將英文全稱更改為“統計產品與服務解決方案”(StatisticalProductandServiceSolutions);如今SPSS已出至版本19.0,而且更名為PASWStatistics。SPSS是一個集數據整理、分析過程、結果輸出等功能于一身的組合式軟件包,是數據處理和統計領域的國際標準軟件之一;SPSSForWindows

是SPSS軟件的Windows版本,它具有清晰、直觀、易學易用、涵蓋面廣的特點。8第8頁,課件共88頁,創作于2023年2月應用統計軟件進行分析的基本過程弄清分析的目的正確收集待處理和分析的數據(目的、影響因素的剔除)弄清統計概念和統計含義,知道統計方法的適用范圍。無需記憶公式選擇一種或幾種統計分析方法來探索性地分析數據讀懂計算機分析的數據結果,發現規律,得出結論9第9頁,課件共88頁,創作于2023年2月從統計方法的構成分類統計方法描述統計推斷統計10第10頁,課件共88頁,創作于2023年2月描述統計:是用圖形、表格和概括性的數字對數據進行描述的統計方法。內容:搜集數據整理數據顯示數據

目的描述數據特征找出數據的基本規律02550Q1Q2Q3Q4¥=30s2=10511第11頁,課件共88頁,創作于2023年2月推斷統計:

研究如何根據樣本數據對總體進行估計、假設檢驗、預測和其他推斷的統計方法。內容參數估計假設檢驗目的對總體特征作出推斷可靠性測度樣本總體12第12頁,課件共88頁,創作于2023年2月實驗內容安排軟件:SPSS18.0目的:掌握統計軟件的基本應用實驗1:數據文件管理實驗2:基本的統計描述實驗3:方差分析實驗4:相關與回歸分析13第13頁,課件共88頁,創作于2023年2月實驗1:數據文件管理§1.1SPSS系統運行管理方式§1.2數據管理窗口介紹§1.3數據文件的建立與管理實驗目的:掌握文件的創建和整理,包括數據的查詢、數據排序、篩選等。14第14頁,課件共88頁,創作于2023年2月§1.1SPSS系統運行管理方式完全窗口菜單運行方式是在數據編輯窗口和輸出觀察窗口中,通過選用菜單項中的各種功能和工具欄中的圖標按鈕來完成各項統計功能的一種運行方式特點:利用對話框操作,簡便直觀,特別適用于初學者和非專業人員;對于某些專業人員來說,可能不能充分滿足其需要。15第15頁,課件共88頁,創作于2023年2月程序運行方式是通過在Syntax(語句)窗口中直接運行編寫好的程序來完成各項統計功能的運行方式特點:方便已習慣使用SPSS語言編寫程序的用戶使用;能簡化某些工作,比如,成批次地處理數據、重復相同的統計分析過程等;專業人員可通過該運行方式,使用某些對話框操作不能實現的功能。混合運行方式是完全窗口菜單運行方式和程序運行方式的結合,既能簡化操作,又可以補充單純窗口運行管理的不足。16第16頁,課件共88頁,創作于2023年2月進行統計分析的基本操作步驟:將數據輸入SPSS(定義變量、錄入數據等),并存盤;進行必要的預分析(進行分布圖、均數、標準差的描述等),以確定應采用的統計分析方法;按分析目的選用統計程序,執行統計分析過程;保存和導出分析結果。第17頁,課件共88頁,創作于2023年2月菜單欄常用工具欄數據欄當前單元格§1.2數據管理窗口介紹18第18頁,課件共88頁,創作于2023年2月File(文件操作)完成文件的調入,存儲,顯示和打印等操作Edit(文件編輯)完成文本或數據內容的選擇、拷貝、粘貼、尋找和替換等操作19第19頁,課件共88頁,創作于2023年2月View(窗口外觀控制)完成文本或數據內容的狀態欄、工具欄、字體、網格線和數值標簽等功能的操作Data(數據管理)完成數據變量名稱和格式的定義,數據資料的選擇、排序、加權、數據文件的轉換、連接和匯總等操作20第20頁,課件共88頁,創作于2023年2月Transform(數據轉換)完成數據值的計算、重新編碼和缺失值替代等操作Analyze(統計分析)完成一系列統計分析的選擇和應用21第21頁,課件共88頁,創作于2023年2月Graphs(統計圖表)完成統計圖表的建立和編輯Utilities(實用程序)有關命令解釋、字體選擇、文件信息、定義輸出標題和窗口設計等Window(窗口控制)可進行窗口的排列、選擇和顯示等操作Help(幫助)幫助文件的調用、查詢和顯示等22第22頁,課件共88頁,創作于2023年2月SPSS數據文件是一種有結構的數據文件,它包括:文件結構數據§1.3數據文件的建立與管理23第23頁,課件共88頁,創作于2023年2月SPSS數據文件中的一列數據稱為一個變量,每個變量都有一個名稱,即變量名,變量名是存取SPSS每個變量的唯一標識。SPSS數據文件的結構是對每個變量及其相關屬性的描述。一行數據稱為一條個案(Case)或觀測,所有個案組成了SPSS數據文件的數據部分。24第24頁,課件共88頁,創作于2023年2月建立SPSS數據文件應通過兩大步驟實現:第一步:定義SPSS數據文件的結構;第二步:輸入分析數據。定義SPSS數據文件的結構;包括:變量名、變量類型、變量寬度、變量名標簽、變量值標簽、缺失值、顯示寬度、顯示的對齊方式、變量的測度類型等信息。

至少要定義變量名和變量類型,其他暫時設為默認值,待分析需要時再設置。25第25頁,課件共88頁,創作于2023年2月在數據編輯窗口中,單擊“變量視圖”的標簽進行設置。變量定義完成后,單擊“數據視圖”的標簽進行具體變量值的錄入。26第26頁,課件共88頁,創作于2023年2月數據編輯在SPSS中,對數據進行基本編輯操作的功能集中在“編輯”和“數據”菜單中。移動指針到指定序號的觀測量

【編輯】——【轉至個案】查找指定變量中的指定數據

【編輯】——【查找】插入一個變量

【編輯】——【插入變量】插入一個觀測量

【編輯】——【插入個案】查看變量信息

【實用程序】——【變量】27第27頁,課件共88頁,創作于2023年2月在數據窗口單擊【數據】【排列個案】,打開對話框。觀測數據排序28第28頁,課件共88頁,創作于2023年2月在統計分析中,有時不需要對所有的觀測進行分析,可能只對某些特定的對象有興趣。利用【數據】【選擇個案】,可以實現。抽樣(篩選)全部個案:選擇所有數據;如果條件滿足:按指定條件選擇數據。單擊如果按紐,打開選擇個案:If對話框,先選擇變量,然后定義條件。29第29頁,課件共88頁,創作于2023年2月選擇個案:If對話框,先選擇變量,然后定義條件。30第30頁,課件共88頁,創作于2023年2月抽樣(篩選)隨機個案樣本:對觀察值進行隨機抽樣。單擊樣本按紐,打開選擇個案:隨機樣本對話框。如圖所示。在樣本尺寸欄中有兩種選擇方式:一種是大約:即鍵入抽樣比例后由系統隨機抽樣;另一種是精確:要求輸入從第幾個觀察值起抽取多少數據。31第31頁,課件共88頁,創作于2023年2月抽樣(篩選)基于時間或個案全距:順序抽樣。單擊范圍按紐,打開選擇個案:范圍對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結束。使用篩選器變量:用指定變量作過濾。先選擇一個變量,系統自動在數據管理器中將該變量值為0的觀測單位標上刪除記號,系統對標有刪除記號的觀測單位不作分析。32第32頁,課件共88頁,創作于2023年2月實驗2:基本的統計描述作為一條普遍的規則,當一批數據中的數據有20個左右或者更多的時候,就應該制作表格或者圖表。這樣,數據的重要特征就能從表格或者圖表中反映出來。其目標也是提高數據分析和數據解釋的效率——這是決策過程的兩個關鍵方面。33第33頁,課件共88頁,創作于2023年2月在建立了數據文件之后,需要對數據作進一步的考察,如了解數據的基本特征,如數據的均值、標準差、四分位點,數據的分布形態等,這個過程稱為對數據進行基本統計描述。所以說,數據的基本統計描述的目的是:了解數據的基本特征和基本分布形狀,為進一步分析做好充分準備。34第34頁,課件共88頁,創作于2023年2月數值描述分布的形狀集中趨勢離散程度眾數中位數平均值標準誤差方差峰態標準差全距偏態35第35頁,課件共88頁,創作于2023年2月眾數:在總體中出現次數最多的那個標志值不受極端值影響具有不惟一性數據分布偏斜程度較大時應用中位數:一組排序的數據中,在中間位置上的數據不受極端值影響數據分布偏斜程度較大時應用均值:全部數據的算術平均易受極端值影響數學性質優良數據對稱分布或接近對稱分布時應用集中趨勢的測度值:36第36頁,課件共88頁,創作于2023年2月數據類型和所適用的集中趨勢測度值定類數據定序數據數量數據適用的測度值眾數*眾數眾數中位數*中位數均值*幾何平均數調和平均數*表示最適合37第37頁,課件共88頁,創作于2023年2月全距:最大值與最小值的差計算方便,易于理解只考慮兩端數據,比較粗略方差:離差平方的平均數準確反映數據的離散程度數據離散程度的最常用測度值標準差:離差平方平均數的平方根準確反映數據的離散程度具有量綱,實際意義清楚數據離散程度的最常用測度值離散程度的測度值:38第38頁,課件共88頁,創作于2023年2月數據類型和所適用的離散程度測度值定類數據定序數據數量數據適用的測度值異眾比率*異眾比率異眾比率四分位差*四分位差

極差、平均差方差、標準差*離散系數*(比較)*表示最適合39第39頁,課件共88頁,創作于2023年2月偏態:分布偏斜方向及程度偏態系數

SK=0為對稱分布偏態系數SK>0

為右偏分布偏態系數SK<0

為左偏分布SK的絕對值越大,表示偏斜的程度就越大分布的形狀:左偏分布均值

中位數

眾數fx右偏分布眾數

中位數均值fx40第40頁,課件共88頁,創作于2023年2月峰度:分布集中趨勢高峰的形狀峰態系數K=0標準正態分布峰態系數K<0為扁平分布峰態系數K>0為尖峰分布分布的形狀:扁平分布尖峰分布與標準正態分布比較!41第41頁,課件共88頁,創作于2023年2月1.描述統計分析2.頻數分析3.探索分析4.列聯表5.統計圖42第42頁,課件共88頁,創作于2023年2月1.描述統計分析描述統計分析是對數據進行基礎性描述的過程。可以通過計算均值、算術和、標準差、極值、方差、均值、標準誤等統計量來描述樣本數據的集中趨勢、離散趨勢及分布特征;描述統計分析過程,可通過分析對話框(分析描述統計描述)來具體實現。43第43頁,課件共88頁,創作于2023年2月例2.1以某年全國職工平均工資表為例(SY-11),要求對其進行簡單的描述統計分析。具體操作步驟如下:1、首先打開數據表SY-11,按照分析(Analyze)描述統計(DescriptivesStatistics)

描述(Descriptives),打開對話框,如圖所示。從左邊源變量中選擇一個或者幾個變量進入右框中計算并保存所選變量的標準化值,公式為44第44頁,課件共88頁,創作于2023年2月2.單擊選項Options按鈕,打開Options對話框,如圖所示:在此例中選擇按平均值升序項,返回主對話框,單擊OK,在輸出窗口得描述統計分析輸出表。45第45頁,課件共88頁,創作于2023年2月輸出結果:標準化值46第46頁,課件共88頁,創作于2023年2月2.頻數分析利用頻數分析可以方便地對數據按組進行歸類整理;形成各變量的不同水平(分組)的頻數分布表及圖形,以便對各變量的數據特征和觀測量的分布狀況有一個概括的認識;47第47頁,課件共88頁,創作于2023年2月48第48頁,課件共88頁,創作于2023年2月例2.2數據文件SY-12是一個公司職員表,其中有性別、年齡,受教育年限等五個變量,具體操作如下:

1、打開數據文件SY-12后,單擊分析描述統計頻率(Frequencies),打開頻數分析對話框。2、在左邊的變量框中選中一個或多個變量。3、選中顯示頻率表格。49第49頁,課件共88頁,創作于2023年2月4、單擊統計量按鈕,得到對話框圖。在頻率:統計量對話框中選擇要求輸出的統計量。50第50頁,課件共88頁,創作于2023年2月5、單擊圖表(Chart)按鈕,得到對話框圖選擇直方圖51第51頁,課件共88頁,創作于2023年2月6、單擊格式(Format)按鈕,得到對話框圖。本例中均選擇系統默認項52第52頁,課件共88頁,創作于2023年2月輸出結果:點擊OK53第53頁,課件共88頁,創作于2023年2月從表和直方圖中可以觀察到該公司32歲至47歲之間的人數最多,占到總人數的60%以上。54第54頁,課件共88頁,創作于2023年2月3探索分析過程探索分析是指對測得的數據進行更為深入詳盡的描述性統計分析。在一般描述性統計指標的基礎上,增加有關數據其他特征的文字與圖形描述,顯得更加細致與全面,有助于用戶思考對數據進行進一步分析的方案。目的是:觀察數據的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數據的分布形式和數據的一些規律性,包括考察數據中是否存在異常值等。正態分布檢驗:檢驗數據是否服從正態分布。方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。55第55頁,課件共88頁,創作于2023年2月以數據庫SY-13提供的兩個班的學習成績數據為例,對兩個班的數學成績按照性別進行數據的分布、按照性別檢驗其數學成績的方差是否相等。打開數據庫SY-13。例2.356第56頁,課件共88頁,創作于2023年2月1、單擊分析(Analyze)->描述統計(Descriptivestatistics)->探索(Explore),打開Explore主對話框。選擇分析變量指定分組變量選擇標識變量從左側的變量列表中選出分析變量,送入因變量列表欄;選擇因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組,再分組考察分析變量中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。選擇標識變量,當輸出涉及到觀測量時,使用該變量值標識各觀測量。57第57頁,課件共88頁,創作于2023年2月2、單擊統計量按鈕,打開對話框,選擇統計輸出量。有四個選擇項,分別是:基本統計描述。同時指定均值的置信區間的置信度,系統默認為95%。M-估計(M估計在計算時對所有觀測量賦予權重,隨觀測量距分布中心的遠近而變化);Outliers輸出分析數據中五個最大值和五個最小值;Percentiles輸出百分數。本例中選擇Descriptives和Outliers后,返回主對話框。。58第58頁,課件共88頁,創作于2023年2月3.單擊繪制按鈕,打開對話框,如圖所示。59第59頁,課件共88頁,創作于2023年2月4、單擊選項按紐,打開對話框。可選擇缺失值的處理方式,SPSS提供三種處理方式:剔除帶有缺失值的觀測量同時剔除缺失值及與其有成對關系的觀測量輸出頻數表時同時輸出缺失值60第60頁,課件共88頁,創作于2023年2月5、單擊OK,得到相應的輸出結果。輸出結果㈠:5%的修正均值:排除掉數據分布兩端5%的變量值之后計算的平均值5%的修正均值:排除掉數據分布兩端5%的變量值之后計算的平均值四分位數間距61第61頁,課件共88頁,創作于2023年2月極端值:按照性別輸出數學成績的五個最大值及五個最小值62第62頁,課件共88頁,創作于2023年2月正態分布檢驗表

從檢驗結果可以看出,由于假設檢驗的P值均大于0.05,故可以認為男女生的數學成績分布都近似地服從正態分布。輸出結果㈡:當顯著性水平P<0.05時,數據就不是正態分布當樣本量小于50時才比較精確63第63頁,課件共88頁,創作于2023年2月莖葉圖輸出結果(三):64第64頁,課件共88頁,創作于2023年2月

按照性別繪制的數學成績的箱圖

(代表變量中間50%的觀測值)從上面的箱圖中可以得出結論:女生的數學成績的平均水平比男生低且分散程度小,但有一個離群值。除了離群值O(距方框上下限超1.5倍盒距)和極值E(距方框上下限超3倍盒距)之外的最大值和最小值上下四分位數、中位數65第65頁,課件共88頁,創作于2023年2月正態圖(也可判斷正態分布,但不能僅僅依靠正態圖)輸出結果(四):【探索】命令會輸出兩種正態圖:NormalQ-Q圖;DetrendedNormalQ-Q圖;66第66頁,課件共88頁,創作于2023年2月正態分布Q-Q圖上圖中間的斜線是服從正態分布的標準線。從上面的分布圖中看出,除個別極端點外,數據點都在斜線周圍波動,故可以認為女生的數學成績近似服從正態分布。67第67頁,課件共88頁,創作于2023年2月縱坐標是期望值(在標準正態分布下的轉換值)68第68頁,課件共88頁,創作于2023年2月離散正態分布圖從上面的離散正態分布圖中看出,除個別極端點外,離散點都在±2的周圍波動,故可以認為女生的數學成績近似服從正態分布。縱坐標是實際觀測值與期望值的差69第69頁,課件共88頁,創作于2023年2月方差齊性檢驗由表得出方差齊性檢驗的P值為0.8以上,故認為男女生數學成績的方差是相等的。輸出結果(五):70第70頁,課件共88頁,創作于2023年2月4列聯表分析當觀察的現象與兩個因素有關時,如某種服裝的銷量受價格和居民收入影響;某種產品的生產成本受原材料價格和產量的影響等等;交叉列聯表分析可以比較好的反映出兩個因素之間有無關聯性,兩因素與現象之間的相關關系。

71第71頁,課件共88頁,創作于2023年2月數據列聯表分析主要包括兩個基本任務:根據收集的樣本數據,產生二維或多維交叉列聯表;在此基礎上,對兩兩變量間是否存在關聯性進行檢驗。變量x是列變量,類別數為c,一般為自變量;變量y是行變量,類別數為r,一般為因變量;72第72頁,課件共88頁,創作于2023年2月下面仍然以數據SY-13學生成績為例,將學生成績按照五級制分等級后,按照班級形成數學等級和物理等級交叉分析表,并考察學生的物理和數學成績間有無關聯性。73第73頁,課件共88頁,創作于2023年2月制作交叉列聯表的具體操作步驟:1、打開數據SY-1,單擊分析描述統計交叉表對話框。二維列聯表分析,選擇行、列變量進入框中。如進行三維以上的列聯表,可以將其它變量作為控制變量選到層(Layer)框中。多控制變量可以是同層次的也可以是逐層疊加的。此例中選擇數學等級為行變量,物理等級為列變量,班級作為控制變量。74第74頁,課件共88頁,創作于2023年2月2、單擊單元格(Cell)按紐,打開對話框。在計數框中選擇觀察值(系統默認)或期望頻數;在百分比框內選擇行、列及總百分比。在殘差框中選擇輸出殘差。本列中選擇默認項觀察值。75第75頁,課件共88頁,創作于2023年2月3、單擊格式(Format)按紐,指定列聯表的輸出排列順序,一般選擇系統默認的升序。然后點擊OK,就可得到交叉列聯表。76第76頁,課件共88頁,創作于2023年2月從上表中可以看出,一班中數學和物理成績均為優秀者有四人,數學不及格的兩人的物理成績都是及格。77第77頁,課件共88頁,創作于2023年2月兩變量關聯性檢驗(Chi-squareTest卡方檢驗)卡方檢驗是一種非參數檢驗方法。可以用來檢驗兩個變量因素之間是否有關聯關系。如果要考察學生的數學成績和物理成績之間是否有關聯,相當于檢驗假設:H0:數學成績和物理成績之間是相互獨立的(無關聯關系);H1:數學成績和物理成績之間的關聯關系顯著。78第78頁,課件共88頁,創作于2023年2月編制列聯表時應注意的問題編制列聯表時,如果兩個變量之間不存在因果關系,行變量和列變量可以隨意指定。在對三個及以上變量進行列聯分析時,一般來說,每個單元格至少要有5個觀測值才能有說服力。列聯表只是檢驗變量之間是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論