統計學第六版賈俊平第1章_第1頁
統計學第六版賈俊平第1章_第2頁
統計學第六版賈俊平第1章_第3頁
統計學第六版賈俊平第1章_第4頁
統計學第六版賈俊平第1章_第5頁
已閱讀5頁,還剩26頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第1章導論作者:中國人民大學統計學院賈俊平PowerPoint統計學第1章導論1.1

統計及其應用領域1.2統計數據的類型1.3統計中的幾個基本概念學習目標1.理解統計學的含義2. 理解描述統計和推斷統計3. 了解統計學的應用領域4. 了解數據的類型5.理解統計中的幾個基本概念2008年8月你相信這樣的一些統計結論嗎?吸煙對健康是有害的,吸香煙的男性減少壽命2250天不結婚的男性會減少壽命3500天,不結婚的女性會減少壽命1600天身體超重30%會使壽命減少1300天每天攝取500毫升維生素C,生命可延長6年身材高的父親,其子女的身高也較高二個出生的子女沒有第一個聰明,第三個出生的子女沒有第二個聰明,依此類推學生們在聽了莫扎特鋼琴曲10分鐘后的推理測試會比他們聽10分鐘娛樂磁帶或其他曲目做得更好上課坐在前面的學生平均考試分數比坐在后面的學生高1.1統計及其應用領域1.1.1什么是統計學1.1.2統計的應用領域什么是統計學?

(statistics)統計學是收集、分析、表述和解釋數據的科學(不列顛百科全書)統計是一門收集、分析、解釋和提供數據的科學(韋伯斯特國際辭典第3版)統計指的是一組方法,用來設計實驗、獲得數據,然后在這些數據的基礎上組織、概括、演示、分析、解釋和得出結論(MarioF.Triola,《初級統計學》)

什么是統計學?

(statistics)1.收集數據:取得數據2.處理數據:整理與圖表展示分析數據:利用統計方法分析數據數據解釋:結果的說明得到結論:從數據分析中得出客觀結論收集、處理、分析、解釋數據并從數據中得出結論的科學

統計方法統計方法描述統計推斷統計參數估計假設檢驗描述統計

(descriptivestatistics)研究數據收集、處理、匯總、圖表描述、概括與分析等統計方法內容搜集數據整理數據展示數據描述性分析目的描述數據特征找出數據的基本規律02550Q1Q2Q3Q4¥x=30s2=105推斷統計

(inferentialstatistics)研究如何利用樣本數據來推斷總體特征的統計方法內容參數估計假設檢驗目的對總體特征作出推斷樣本總體統計的應用領域經濟學管理學醫學工程學社會學…

統計學2008年8月統計的應用領域【例1.1】用統計識別作者

1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison為了說服紐約人認可憲法,匿名發表了著名的85篇論文。這些論文中的大多數作者已經得到了識別,但是,其中的12篇論文的作者身份引起了爭議通過對不同單詞的頻數進行統計分析,得出的結論是,JamesMadison最有可能是這12篇論文的作者。現在,對于這些存在爭議的論文,認為JamesMadison是原創作者的說法占主導地位,而且幾乎可以肯定這種說法是正確2008年8月統計的應用領域【例1.2】用簡單的描述統計量得到一個重要發現

費舍(R.A.Fisher)在1952的一篇文章中舉了一個例子,說明如何由基本的描述統計量的知識引出一個重要的發現。20世紀早期,哥本哈根卡爾堡實驗室的施密特(J.Schmidt)發現不同地區所捕獲的同種魚類的脊椎骨和鰓線的數量有很大不同;甚至在同一海灣內不同地點所捕獲的同種魚類,也發現這樣的傾向然而,鰻魚的脊椎骨的數量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚的樣本中,計算發現了幾乎一樣的均值和標準偏差值。由此,施密特推斷所有各個不同海域內的鰻魚是由海洋中某公共場所繁殖的。后來名為“戴納(Dana)”的科學考察船在一次遠征中發現了這個場所2008年8月統計的應用領域【例1.3】挑戰者號航天飛機失事預測

1986年1月28日清晨,載有7名宇航員的挑戰者號進入發射狀態。就在發射前,有冰片牢附在機殼上。幾分鐘后,正當電視新聞報道它已進入軌道時,航天飛機在毀滅性的爆炸聲中化成碎片,機上的宇航員片骨未存推動航天飛機進入太空的兩個固體燃料發動機是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的經理們和國家航空航天局就如期發射還是推遲發射產生了爭執。天氣預報發射時的氣溫為310F。爭執的結果采納了Thiokol公司經理們的建議:按計劃發射航天飛機。因為他們覺得沒有確鑿證據表明低溫會對固體燃料火箭推進器的性能產生影響2008年8月統計的應用領域【例1.3】挑戰者號航天飛機失事預測在此次失事前,該航天飛機24次發射成功。將航天飛機送入太空的兩個固體燃料推進器由6只O型項圈密封。在幾次飛行中,曾發生過O型項圈被腐蝕或氣體泄漏事故。這樣的事故是及其危險的。前24次發射中有一次發動機遭到了永久性破壞。根據23次飛行中發生腐蝕或泄漏事故的次數(因變量)及火箭連接處的溫度(自變量)數據,進行線性回歸得到的回歸方程為當溫度為310F時,O型項圈發生事故的預計次數為2.225次。結果顯示連接處的溫度與O型項圈事故之間有一定的相關性。如果當時那些經理們看到了回歸的預測結果,也許推遲發射會成為其謹慎的選擇統計的應用領域actuarialwork

(精算)

agriculture

(農業)animalscience

(動物學)

anthropology

(人類學)archaeology(考古學)

auditing(審計學)crystallography(晶體學)

demography(人口統計學)dentistry(牙醫學)

ecology

(生態學)econometrics(經濟計量學)

education(教育學)electionforecastingandprojection

(選舉預測和策劃)engineering(工程)

epidemiology(流行病學)finance(金融)fisheriesresearch

(水產漁業研究)gambling(賭博)

genetics(遺傳學)geography(地理學)

geology(地質學)historicalresearch

(歷史研究)

humangenetics

(人類遺傳學)統計的應用領域hydrology(水文學)

industry

(工業)linguistics

(語言學)

literature(文學)manpowerplanning

(勞動力計劃)managementscience

(管理科學)marketing(市場營銷學)

medicaldiagnosis

(醫學診斷)meteorology(氣象學)

militaryscience

(軍事科學)nuclearmaterialsafeguards

(核材料安全管理)ophthalmology(眼科學)

pharmaceutics(制藥學)physics

(物理學)

politicalscience

(政治學)psychology(心理學)

psychophysics(心理物理學)qualitycontrol

(質量控制)

religiousstudies

(宗教研究)sociology

(社會學)

surveysampling

(調查抽樣)taxonomy(分類學)

weathermodification

(氣象改善)1.2.1分類數據、順序數據、數值型數據1.2.2觀測數據和實驗數據1.2.3截面數據和時間序列數據1.2統計數據的類型統計數據的分類統計數據的分類按計量層次分類的數據順序的數據數值型數據按時間狀況截面的數據時序的數據按收集方法觀察的數據實驗的數據統計數據的分類

(按計量尺度分)分類數據(categoricaldata)

只能歸于某一類別的非數字型數據對事物進行分類的結果,數據表現為類別,用文字來表述例如,人口按性別分為男、女兩類

順序數據(rankdata)

只能歸于某一有序類別的非數字型數據對事物類別順序的測度,數據表現為類別,用文字來表述例如,產品分為一等品、二等品、三等品、次品等數值型數據(metricdata)

按數字尺度測量的觀察值結果表現為具體的數值,對事物的精確測度例如:身高為175cm、168cm、183cm分類變量和順序變量統稱為定性變量(qualitativevariable)統計數據的分類

(按收集方法分)觀測的數據(observationaldata)

通過調查或觀測而收集到的數據在沒有對事物人為控制的條件下而得到的有關社會經濟現象的統計數據幾乎都是觀測數據實驗的數據(experimentaldata)

在實驗中控制實驗對象而收集到的數據比如,對一種新藥療效的實驗,對一種新的農作物品種的實驗等自然科學領域的數據大多數都為實驗數據統計數據的分類

(按時間狀況分)截面數據(cross-sectionaldata)

在相同或近似相同的時間點上收集的數據描述現象在某一時刻的變化情況比如,2005年我國各地區的國內生產總值數據時間序列數據(timeseriesdata)

在不同時間上收集到的數據描述現象隨時間變化的情況比如,2000年至2005年國內生產總值數據1.3統計中的幾個基本概念1.3.1總體和樣本1.3.2參數和統計量1.3.3變量總體和樣本總體(population)所研究的全部個體(數據)的集合,其中的每一個個體也稱為元素分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數目是有限的無限總體所包括的元素是無限的,不可數的樣本(sample)從總體中抽取的一部分元素的集合構成樣本的元素的數目稱為樣本容量或樣本量(samplesize)參數和統計量參數(parameter)描述總體特征的概括性數字度量,是研究者想要了解的總體的某種特征值所關心的參數主要有總體均值()、標準差()、總體比例()等總體參數通常用希臘字母表示統計量(statistic)用來描述樣本特征的概括性數字度量,它是根據樣本數據計算出來的一些量,是樣本的函數所關心的樣本統計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等樣本統計量通常用小寫英文字母來表示變量

(variable)

說明現象某種特征的概念如商品銷售額、受教育程度、產品的質量等級等變量的具體表現稱為變量值,即數據變量可以分為分類變量(categoricalvariable)

:說明事物類別的名稱順序變量(rankvariable):說明事物有序類別的名稱數值型變量(metricvariable)

:說明事物數字特征的名稱

離散變量:取有限個值連續變量:可以取無窮多個值變量

(其他分類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論