




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
簡明應用統計學
(第2版)
第1章統計學緒論1.1
引言1.2什么是統計學1.3為什么要學習統計學1.4統計學的類型1.5變量的類型1.6測量的水平1.7數據的收集1.8統計軟件學習目標1.理解我們為什么要學習統計學。2.什么是描述統計學和推斷統計學。3.區別定性變量和定量變量,區別離散變量和連續變量。4.區別變量的定類、定序、定距和定比測度水平。5.知道數據的四種收集方式。6.知道常用的統計軟件。根據最新的研究結果,消費者的行為對自然資源到底有怎樣的影響呢?你應該買使用柴油發動機的汽車,還是購買電動車,或者干脆騎自行車呢?報紙、雜志或網絡中的統計結果對于你的決定非常關鍵,這些結果建議你該有怎樣的消費觀。1.1引言在金融危機發生后,各國政府對于國家經濟的現狀和對未來經濟走勢的預測十分關注,每個月都要編制CPI等各類指數以評價通貨膨脹情況。有關商品銷售額、新開工的住宅、貨幣流通以及工業生產的信息僅僅是構成預測基礎的成百上千類信息的一小部分。我們該如何解讀這些數據呢?知道一些統計知識有助于我們知道這些數據是如何與我們的生活息息相關的。假設你是市場部的新任經理,一次廣告活動的統計結果擺到了你面前,聲稱某個結果是“統計顯著”的。你如何解釋這份報告而又不暴露你對該術語的無知呢?趕快學點統計,這對你和你的事業都非常有用。1.1引言統計學是收集、分析、表述和解釋數據的科學(不列顛百科全書)統計是一門收集、分析、解釋和提供數據的科學(韋伯斯特國際辭典第3版)統計指的是一組方法,用來設計實驗、獲得數據,然后在這些數據的基礎上組織、概括、演示、分析、解釋和得出結論(MarioF.Triola,《初級統計學》)
統計學是數據的科學和藝術1.2
什么是統計學?
(statistics)1.收集數據:取得數據2.處理數據:整理與圖表展示分析數據:利用統計方法分析數據數據解釋:結果的說明得到結論:從數據分析中得出客觀結論收集、處理、分析、解釋數據并從數據中得出結論的科學1.2
什么是統計學?
(statistics)2009年8月6日《紐約時報》發表大幅文章《當今大學畢業生的唯一關鍵詞是:統計學》(ForToday‘sGraduate,JustOneWord:Statistics).文章舉例說明統計對各行各業的重要性。2009年8月25日華爾街雜志刊登《有利于找工作的5個專業》文章,認為在美國“工程、生命科學、統計學、環境研究和金融”是就業市場最受歡迎的專業。2010年6月3日第64屆聯合國大會第90次會議通過決議,每年10月20日被聯合國確定為“世界統計日”。體現出全世界對統計數據和統計空前的關注和重視。2011年2月美國《科學》雜志以數據為主題出版專刊,學術界對數據和數據分析高度關注。1.3
為什么要學習統計學統計在許多學科中得到廣泛的應用。比如說,學術研究雜志就依賴于統計結果。在許多學科中,一篇文章是否能夠發表在主要雜志上,在很大程度上取決于該文章是否能正確地使用統計方法。除了學術領域,統計在其他領域也被人們廣泛使用。統計在工業中得到大量使用,尤其用于研究新產品、質量控制和市場開發中;市場調查也需要統計。1.3
為什么要學習統計學統計的應用領域經濟學管理學醫學工程學社會學…
統計學統計的應用領域actuarialwork(精算)agriculture(農業)animalscience(動物學)anthropology(人類學)archaeology(考古學)auditing(審計學)crystallography(晶體學)demography(人口統計學)dentistry(牙醫學)ecology(生態學)econometrics(經濟計量學)education(教育學)electionforecastingandprojection(選舉預測和策劃)engineering(工程)epidemiology(流行病學)finance(金融)fisheriesresearch(水產漁業研究)gambling(賭博)genetics(遺傳學)geography(地理學)geology(地質學)historicalresearch(歷史研究)humangenetics(人類遺傳學)統計的應用領域hydrology(水文學)industry(工業)linguistics(語言學)literature(文學)manpowerplanning(勞動力計劃)managementscience(管理科學)marketing(市場營銷學)medicaldiagnosis(醫學診斷)meteorology(氣象學)militaryscience(軍事科學)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科學)pharmaceutics(制藥學)physics(物理學)politicalscience(政治學)psychology(心理學)psychophysics(心理物理學)qualitycontrol(質量控制)religiousstudies(宗教研究)sociology(社會學)surveysampling(調查抽樣)taxonomy(分類學)weathermodification(氣象改善)1.3
為什么要學習統計學
(1)數據無處不在。
(2)統計學技術對于我們做出影響日常生活的許多決
策都十分有用。
(3)無論你以后從事什么工作,你都會面臨與數據打
交道做出決策的問題。對統計學方法的了解將有
助于你更加有效的做出決策。數據收集過程:抽樣(sampling)。比如,為了估計某一家超市所有顧客平均年齡,你只需要收集部分顧客的年齡信息,得到平均年齡的估計以后,你就可以針對這個年齡層的顧客,制定相應廣告信息。統計涉及兩個不同階段:(1)描述數據集和(2)根據樣本信息得出結論(估計、預測等)。統計的應用可以被分為兩個部分:描述統計學和推斷統計學。1.4統計學的類型1.4統計學的類型統計方法描述統計推斷統計參數估計假設檢驗描述統計
(descriptivestatistics)
研究數據收集、處理、匯總、圖表描述、概括與分析等統計方法內容搜集數據整理數據展示數據描述性分析目的描述數據特征找出數據的基本規律02550Q1Q2Q3Q4¥x=30s2=105推斷統計
(inferentialstatistics)
研究如何利用樣本數據來推斷總體特征的統計方法內容參數估計假設檢驗目的對總體特征作出推斷樣本總體1.5變量
(variable)變量是說明現象某種特征的概念如商品銷售額、受教育程度、產品的質量等級等變量的具體表現稱為變量值,即數據變量的值(value)通常是對某一特定個體的度量,特定個體可能是指一個人,一個家庭,一個地區,或一個國家。從表中可知,性別變量是以人為個體的觀測,孩子的數目是以家庭為個體的觀測。變量變量的值個體性別男,女人學歷小學,中學,本科,碩士,博士人失業有工作,無工作人孩子數0,
1,
2,
3,…家庭貧困程度嚴重,一般,邊緣,沒有地區
變量
(variable)定性變量(qualitativevariable)或屬性變量(attributevariable)定性變量取的值稱為水平(level)或者類(class)。比如,姓名、性別、行業、出生地、國籍/地區以及汽車類型都是定性變量。定性數據通常以餅圖或者條形圖(詳見第2章)的形式表示。定量變量(quantitativevariable)定量變量例子比較多,比如年齡、壽命、公司的員工人數、薪水金額等等。定量變量又可以分為連續的和離散的。離散變量(discretevariable)只能取某些特定的值,并且不同取值之間通常都存在著間距。比如具有某種特征的人口(取正整數值)、某種事故發生的次數(非負整數)、足球射門次數等等。連續變量(continuousvariable)的觀測值可以遍取某一區間中的任何值。身高、體重、長度等等都是連續變量的例子。變量的類型
(variable)【例1.1】下面是關于是否喜歡鍛煉的部分調查數據。性別鍛煉的態度出生日期身高體重男非常喜歡17065女喜歡17560女一般16561男不太喜歡17970男很討厭15345男喜歡18065女一般17255女非常喜歡16752表1.1是否喜歡鍛煉的部分調查數據表1.1中的姓名、是否鍛煉為定性變量。出生日期、身高和體重為定量變量,出生日期是離散變量,而身高和體重為連續變量。變量
(例題分析)變量
(其他分類)隨機變量和非隨機變量經驗變量(empiricalvariables)和理論變量(theoreticalvariables)經驗變量所描述的是我們周圍可以觀察到的事物理論變量則是由統計學家用數學方法所構造出來的一些變量,比如,z
統計量、t統計量、2統計量、F統計量等變量及其類型數據還可以按照測量水平進行分類。數據的測量水平通常制約著在數據概括和顯示時可以選用的計算方法,它還決定著應該使用何種統計檢驗方法。1.6測量的水平通常,可以從下面幾個方面獲得數據:來自于公開發表資料中的數據統計年鑒有關期刊有關網站實驗設計數據調查數據觀察數據1.7數據收集統計數據的分類統計數據的分類按計量層次分類的數據順序的數據數值型數據按時間狀況截面的數據時序的數據按收集方法觀察的數據實驗的數據統計數據的分類
(按計量尺度分)分類數據(categoricaldata)
只能歸于某一類別的非數字型數據對事物進行分類的結果,數據表現為類別,用文字來表述例如,人口按性別分為男、女兩類順序數據(rankdata)
只能歸于某一有序類別的非數字型數據對事物類別順序的測度,數據表現為類別,用文字來表述例如,產品分為一等品、二等品、三等品、次品等數值型數據(metricdata)
按數字尺度測量的觀察值結果表現為具體的數值,對事物的精確測度例如:身高為175cm、168cm、183cm觀測的數據(observationaldata)通過調查或觀測而收集到的數據在沒有對事物人為控制的條件下而得到的有關社會經濟現象的統計數據幾乎都是觀測數據實驗的數據(experimentaldata)在實驗中控制實驗對象而收集到的數據比如,對一種新藥療效的實驗,對一種新的農作物品種的實驗等自然科學領域的數據大多數都為實驗數據統計數據的分類
(按收集方法分)統計數據的分類
(按時間狀況分)截面數據(cross-sectionaldata)
在相同或近似相同的時間點上收集的數據描述現象在某一時刻的變化情況比如,2005年我國各地區的國內生產總值數據時間序列數據(timeseriesdata)
在不同時間上收集到的數據描述現象隨時間變化的情況比如,2000年至2005年國內生產總值數據數據收集的第一個準則是要清楚測量的是什么。換句話說,變量必須有一個明確的適合研究目的的定義。這有時是說起來容易做起來難。如果我們對問題考慮得不全面,那么就沒理由指望回答問題的人(一般稱為響應者)能按照我們期望的回答問題。在我們做研究之前,對變量必須要有一個清晰、詳盡的定義。1.7數據收集:定義變量假定我們在一次食品企業的市場調查中包含了這樣的問題"在您的家庭中有多少個孩子?"我們也許認為自己知道想要了解的是什么,但是,沒有理由期待響應者和我們有同樣的想法。我們也許不加考慮地認為,"孩子"應定義為一個不滿18歲并和他(她)的親生父母一起生活的人。但如果一個家庭中包含大于18歲的親生子女、前妻或前夫的孩子、養子或養女、過繼子女或者其他年輕的親戚,那該怎么辦呢?對于不和親生父母生活在一起的孩子怎么算呢?對于父母離了婚而共同撫養的孩子怎么算呢?這有很多種發生混淆的可能。因此,我們在調查之前首先需要明確"孩子"的定義。1.7數據收集:定義變量數據表通常叫做數據陣或數據文件。下表是一個根據抽樣調查得來的數據生成的小數據陣的例子。
序號年齡性別態度120男反對223男贊成317女反對438女中立525女贊成643男贊成738男中立851女贊成935男贊成1039女反對1.7數據收集:數據表在計算機分析數據時,需要把數據文件中的描述性文字轉化成數字。每一個人都被分配一個身份號碼作為名字。年齡變量本來就是用數字測量的,因此不需要任何轉化。性別變量的兩個取值是“女”或“男”,因此,“女”用數字0代替,“男”用數字1代替。當然還可以使用任何兩個別的數字,比如用17代替“女”,用23代替“男”。“態度”這個值可以用三個等級數1、2和3表示反對、中立和贊成。序號年齡性別態度1201122313317014380252503643137381285103935131039011.7數據收集:數據表統計軟件的發展,使得只要輸入你的數據,選一些選項,馬上就得到令人驚嘆的漂亮結果了。那么,傻瓜式統計軟件的使用可以代替統計課程了?當然不是。數據的整理和識別,方法的選用,計算機輸出結果的理解都不像使用傻瓜相機那樣簡單可靠。而且,只要數據格式無誤、選項不矛盾而且不用零作為除數,統計軟件就一定給你結果,而且幾乎沒有任何警告。另外,統計軟件輸出的結果太多。即使是同樣的方法,不同軟件輸出的內容還不一樣,甚至有時同樣的內容名稱也不一樣。因此,應該特別留神,明白自己是在干什么,不要在得到一堆毫無意義的垃圾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息技術貸款居間合同
- 有色金屬貸款居間合同
- 2024泰來縣職業技術教育中心學校工作人員招聘考試及答案
- 2024湖南省衡陽市第五技工學校工作人員招聘考試及答案
- 離婚雙方財產分割合同書
- 舞蹈教師合作合同及條款
- 化工制圖與識圖試題庫與參考答案
- 采購合同范文大全
- 電路理論考試題(附答案)
- 酒店餐飲部后廚承包合同
- 叉車日常維護保養檢查記錄表
- (完整版)創傷后應激障礙量表平民版_PCL-C
- 仿生魚機器人設計說明書
- Q∕GDW 12070-2020 配電網工程標準化設計圖元規范
- (精心整理)小學英語特殊疑問句練習(帶答案)
- 小學語文人教課標版(部編)三年級下冊習作:我做了一項小實驗
- 廣西壯族自治區建筑裝飾裝修工程消耗量定額(2013版)
- 中國歷史朝代簡表全
- 鐵總計統【2017】177號關于進一步加強鐵路建設項目征地拆遷工作和費用管理的指導意見
- 蹲踞式起跑PPT
- 1云南省初中綜合素質,完整版綜合素質評定表
評論
0/150
提交評論