《統計學-基于Excel》(第 4 版)課件 第1章 統計學與數據(Excel-4)_第1頁
《統計學-基于Excel》(第 4 版)課件 第1章 統計學與數據(Excel-4)_第2頁
《統計學-基于Excel》(第 4 版)課件 第1章 統計學與數據(Excel-4)_第3頁
《統計學-基于Excel》(第 4 版)課件 第1章 統計學與數據(Excel-4)_第4頁
《統計學-基于Excel》(第 4 版)課件 第1章 統計學與數據(Excel-4)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

賈俊平2025/4/10統計學—基于Excel(第4版)21世紀統計學系列教材課程內容描述統計、推斷統計、其他方法使用軟件Excel學分與課時

2或3學分,1~17周,每周2或3課時課程簡介賈俊平2025/4/101.1統計學與數據分析1.2變量、數據及其分類1.3數據的來源1.4Excel數據分析工具的安裝

第1章統計學與數據問題與思考在你的印象中,統計學是什么?你日常生活和工作中都接觸過哪些數據?調查一批人的性別、職業、月收入等,這里涉及了哪些變量?如果讓你在全校大學生中做一次調查,你會調查所有的學生還是抽取一部分學生做調查?假定讓你從全校10000名學生中隨機抽取200人,你會怎么做?你都使用過哪些軟件,Excel?SPSS?R?Python?還是其他?你認為不使用軟件能做統計分析嗎?

1.1

統計學與數據分析統計學(statistics)是分析數據的一門科學它提供一套通用于所有學科領域的獲取數據、處理數據、分析數據并從數據中得出結論的原則和方法它不是為某個特定的問題領域構造的,因此,統計方法不是一成不變的使用者在特定情況下需要根據所掌握的專業知識選擇使用這些方法,如果需要,還可以進行必要的修正什么是統計學什么是數據分析(dataanalysis)

運用統計方法對收集來的數據進行分析,從中提取有用信息并得出結論的過程數據分析的目的是把隱藏在數據中的信息有效地提煉出來,從而找出所研究對象的內在規律和特征在實際應用中,數據分析可幫助人們做出判斷和決策,以便采取適當行動數據分析方法與工具

1.1

統計學與數據分析從分析目的看

可數據分析分為描述性分析(descriptiveanalysis)、探索性分析(exploratoryanalysis)和驗證性分析(confirmatoryanalysis)三大類。其中,描述性分析和是對數據進行初步的整理、展視和概括性度量,以找出數據的基本特征;探索性分析側重于在數據之中發現新的特征,為形成某種理論或假設而對數據進行的分析;驗證性分析則側重于對已有理論或假設的證實或證偽。從所使用的統計分析方法看

可分為描述統計(descriptivestatistics)和推斷統計(inferentialstatistics)兩大類。描述統計主要是利用圖表形式對數據進行匯總和展示,計算一些簡單的統計量(諸如比例、比率、平均數、標準差等)進行分析。推斷統計主要是根據樣本信息來推斷總體的特征,內容包括參數估計和假設檢驗等。參數估計是利用樣本信息推斷所關心的總體特征,假設檢驗則是利用樣本信息判斷對總體的某個假設是否成立

1.1

統計學與數據分析數據分析方法與工具——數據分析的分類數據分析方法從分析目的看描述性分析探索性分析驗證性分析從統計方法看描述統計推斷統計商業軟件——不推薦使用

商業類軟件種類繁多,較有代表性的軟件有SAS、SPSS、Minitab、Stata等。多數人較熟悉的Excel雖然不是統計軟件,但提供了一些常用的統計函數以及數據分析工具這類軟件雖有不同的側重點,但功能大同小異,基本上能滿足大多數人做數據分析的需要。商業類軟件使用相對簡單,容易上手主要問題是價格不菲,多數人難以承受,此外,更新速度慢,難以提供最新方法的解決方案

1.1

統計學與數據分析數據分析方法與工具——軟件分類非商業軟件——推薦使用

非商業類軟件則不存在價格問題。目前較為流行的軟件有R語言和Python語言,二者都是免費的開源平臺R語言的一種優秀的統計軟件,它是一種統計計算語言。R具有更新速度快,可以包含最新方法的解決方案;提供豐富的數據分析和可視化技術,功能十分強大。此外,R軟件中的包(package)和函數均由統計專家編寫,函數中參數的設置也更符合統計和數據分析人員的思維方式和邏輯,并有強大的幫助功能和多種范例,初學者也很容易上手Python則是一種面向對象的解釋型高級編程語言,擁有豐富而強大的開源第三方庫,也具有強大的數據分析可視化功能。Python于R的側重點略有不同,R的主要功能是數據分析和可視化,且功能強大,多數分析都可以由R提供的函數實現,不需要太多的編程,代碼簡單,容易上手。Python的側重點則是編程,具有很好的普適性,但數據分析并不是其側重點,雖然從理論上說都可以實現,但往往需要編寫很長的代碼,幫助功能也不夠強大,這對數據分析的初學者來說可能顯得麻煩,但仍然不失為一種有效的數據分析工具

1.1

統計學與數據分析數據分析方法與工具——軟件分類數據(data)數據是個廣義的概念,任何可觀測并有記錄的信息都可以稱為數據,它不僅僅包括數字,也包括文本、圖像等。比如,一篇文章也可以看作數據,一幅照片也可以視為數據,等等本書使用的數據概念則是狹義的,僅僅是指統計變量的觀測結果。因此,要理解數據的概念,需要先清楚變量的概念變量的觀測結果變量(variable)描述所觀察對象某種特征的概念每次的觀察結果可能不同如,“企業銷售額”、“上漲股票的家數”、“生活費支出”、“投擲一枚骰子出現的點數”等就是變量

1.2

變量、數據及其分類變量和數據數據是變量的觀測結果,因此,數據的分類與變量的分類是相同的本書混合使用變量和數據這兩個概念在講述分析方法時多使用變量的概念,在例題分析中多使用數據的概念了解變量或數據的分類十分必要,因為不同的變量或數據適用的分析方法是不同的變量分類類別變量(定性)無序類別變量(名義值)有序類別變量(順序值)布爾變量(二值)數值變量(定量)離散變量(離散值)連續變量(連續值)時間變量(定性或定量)定性:離散值定量:連續值

1.2

變量、數據及其分類變據(變量)的分類間接來源——二手數據直接來源——抽取樣本總體(population):包含所研究的全部個體(或數據)的集合樣本(sample):從總體中抽取的一部分元素的集合樣本量(samplesize):構成樣本的元素的數目概率抽樣方法根據已知的概率抽取樣本元素,也稱隨機抽樣簡單隨機抽樣從總體N個單位(元素)中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中抽取元素的具體方法有放回抽樣和無放回抽樣分層抽樣將總體單位按某種特征或規則劃分為不同層,再從不同的層中隨機地抽取樣本系統抽樣將總體中的所有單位(抽樣單位)按一定順序排列,在規定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規定好的規則確定其他樣本元素整群抽樣將總體中若干個單位合并為組(群),抽樣時直接抽取群,再對中選群中的所有單位全部實施調查

1.3

數據的來源直接來源和間接來源第

1步:在Excel工作表界面中點擊【文件】

【選項】第

2步:在彈出的對話框中選擇【加載項】,并在“加載項”下選擇【分析工具庫】第3步:點擊【轉到】,出現的界面如下圖所示。選中需要的加載宏,單擊【確定】,即可完成安裝

1.4

數Excel【數據分析】工具的安裝直接Excel【數據分析】工具的安裝(2019版)描述應用推斷思維導圖本書基本框架本書基本框架數據來源和分類第1章統計和數據數據處理第2章數據處理描述分析可視化分析第3章數據可視化統計量分析第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論