《統(tǒng)計(jì)學(xué)-基于Excel》(第 4 版)課件全套 賈俊平 第1-9章 統(tǒng)計(jì)學(xué)與數(shù)據(jù)- 時(shí)間序列分析和預(yù)測(cè)_第1頁(yè)
《統(tǒng)計(jì)學(xué)-基于Excel》(第 4 版)課件全套 賈俊平 第1-9章 統(tǒng)計(jì)學(xué)與數(shù)據(jù)- 時(shí)間序列分析和預(yù)測(cè)_第2頁(yè)
《統(tǒng)計(jì)學(xué)-基于Excel》(第 4 版)課件全套 賈俊平 第1-9章 統(tǒng)計(jì)學(xué)與數(shù)據(jù)- 時(shí)間序列分析和預(yù)測(cè)_第3頁(yè)
《統(tǒng)計(jì)學(xué)-基于Excel》(第 4 版)課件全套 賈俊平 第1-9章 統(tǒng)計(jì)學(xué)與數(shù)據(jù)- 時(shí)間序列分析和預(yù)測(cè)_第4頁(yè)
《統(tǒng)計(jì)學(xué)-基于Excel》(第 4 版)課件全套 賈俊平 第1-9章 統(tǒng)計(jì)學(xué)與數(shù)據(jù)- 時(shí)間序列分析和預(yù)測(cè)_第5頁(yè)
已閱讀5頁(yè),還剩212頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

賈俊平2025/4/10統(tǒng)計(jì)學(xué)—基于Excel(第4版)21世紀(jì)統(tǒng)計(jì)學(xué)系列教材課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他方法使用軟件Excel學(xué)分與課時(shí)

2或3學(xué)分,1~17周,每周2或3課時(shí)課程簡(jiǎn)介賈俊平2025/4/101.1統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析1.2變量、數(shù)據(jù)及其分類(lèi)1.3數(shù)據(jù)的來(lái)源1.4Excel數(shù)據(jù)分析工具的安裝

第1章統(tǒng)計(jì)學(xué)與數(shù)據(jù)問(wèn)題與思考在你的印象中,統(tǒng)計(jì)學(xué)是什么?你日常生活和工作中都接觸過(guò)哪些數(shù)據(jù)?調(diào)查一批人的性別、職業(yè)、月收入等,這里涉及了哪些變量?如果讓你在全校大學(xué)生中做一次調(diào)查,你會(huì)調(diào)查所有的學(xué)生還是抽取一部分學(xué)生做調(diào)查?假定讓你從全校10000名學(xué)生中隨機(jī)抽取200人,你會(huì)怎么做?你都使用過(guò)哪些軟件,Excel?SPSS?R?Python?還是其他?你認(rèn)為不使用軟件能做統(tǒng)計(jì)分析嗎?

1.1

統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析統(tǒng)計(jì)學(xué)(statistics)是分析數(shù)據(jù)的一門(mén)科學(xué)它提供一套通用于所有學(xué)科領(lǐng)域的獲取數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的原則和方法它不是為某個(gè)特定的問(wèn)題領(lǐng)域構(gòu)造的,因此,統(tǒng)計(jì)方法不是一成不變的使用者在特定情況下需要根據(jù)所掌握的專(zhuān)業(yè)知識(shí)選擇使用這些方法,如果需要,還可以進(jìn)行必要的修正什么是統(tǒng)計(jì)學(xué)什么是數(shù)據(jù)分析(dataanalysis)

運(yùn)用統(tǒng)計(jì)方法對(duì)收集來(lái)的數(shù)據(jù)進(jìn)行分析,從中提取有用信息并得出結(jié)論的過(guò)程數(shù)據(jù)分析的目的是把隱藏在數(shù)據(jù)中的信息有效地提煉出來(lái),從而找出所研究對(duì)象的內(nèi)在規(guī)律和特征在實(shí)際應(yīng)用中,數(shù)據(jù)分析可幫助人們做出判斷和決策,以便采取適當(dāng)行動(dòng)數(shù)據(jù)分析方法與工具

1.1

統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析從分析目的看

可數(shù)據(jù)分析分為描述性分析(descriptiveanalysis)、探索性分析(exploratoryanalysis)和驗(yàn)證性分析(confirmatoryanalysis)三大類(lèi)。其中,描述性分析和是對(duì)數(shù)據(jù)進(jìn)行初步的整理、展視和概括性度量,以找出數(shù)據(jù)的基本特征;探索性分析側(cè)重于在數(shù)據(jù)之中發(fā)現(xiàn)新的特征,為形成某種理論或假設(shè)而對(duì)數(shù)據(jù)進(jìn)行的分析;驗(yàn)證性分析則側(cè)重于對(duì)已有理論或假設(shè)的證實(shí)或證偽。從所使用的統(tǒng)計(jì)分析方法看

可分為描述統(tǒng)計(jì)(descriptivestatistics)和推斷統(tǒng)計(jì)(inferentialstatistics)兩大類(lèi)。描述統(tǒng)計(jì)主要是利用圖表形式對(duì)數(shù)據(jù)進(jìn)行匯總和展示,計(jì)算一些簡(jiǎn)單的統(tǒng)計(jì)量(諸如比例、比率、平均數(shù)、標(biāo)準(zhǔn)差等)進(jìn)行分析。推斷統(tǒng)計(jì)主要是根據(jù)樣本信息來(lái)推斷總體的特征,內(nèi)容包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)等。參數(shù)估計(jì)是利用樣本信息推斷所關(guān)心的總體特征,假設(shè)檢驗(yàn)則是利用樣本信息判斷對(duì)總體的某個(gè)假設(shè)是否成立

1.1

統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析數(shù)據(jù)分析方法與工具——數(shù)據(jù)分析的分類(lèi)數(shù)據(jù)分析方法從分析目的看描述性分析探索性分析驗(yàn)證性分析從統(tǒng)計(jì)方法看描述統(tǒng)計(jì)推斷統(tǒng)計(jì)商業(yè)軟件——不推薦使用

商業(yè)類(lèi)軟件種類(lèi)繁多,較有代表性的軟件有SAS、SPSS、Minitab、Stata等。多數(shù)人較熟悉的Excel雖然不是統(tǒng)計(jì)軟件,但提供了一些常用的統(tǒng)計(jì)函數(shù)以及數(shù)據(jù)分析工具這類(lèi)軟件雖有不同的側(cè)重點(diǎn),但功能大同小異,基本上能滿足大多數(shù)人做數(shù)據(jù)分析的需要。商業(yè)類(lèi)軟件使用相對(duì)簡(jiǎn)單,容易上手主要問(wèn)題是價(jià)格不菲,多數(shù)人難以承受,此外,更新速度慢,難以提供最新方法的解決方案

1.1

統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析數(shù)據(jù)分析方法與工具——軟件分類(lèi)非商業(yè)軟件——推薦使用

非商業(yè)類(lèi)軟件則不存在價(jià)格問(wèn)題。目前較為流行的軟件有R語(yǔ)言和Python語(yǔ)言,二者都是免費(fèi)的開(kāi)源平臺(tái)R語(yǔ)言的一種優(yōu)秀的統(tǒng)計(jì)軟件,它是一種統(tǒng)計(jì)計(jì)算語(yǔ)言。R具有更新速度快,可以包含最新方法的解決方案;提供豐富的數(shù)據(jù)分析和可視化技術(shù),功能十分強(qiáng)大。此外,R軟件中的包(package)和函數(shù)均由統(tǒng)計(jì)專(zhuān)家編寫(xiě),函數(shù)中參數(shù)的設(shè)置也更符合統(tǒng)計(jì)和數(shù)據(jù)分析人員的思維方式和邏輯,并有強(qiáng)大的幫助功能和多種范例,初學(xué)者也很容易上手Python則是一種面向?qū)ο蟮慕忉屝透呒?jí)編程語(yǔ)言,擁有豐富而強(qiáng)大的開(kāi)源第三方庫(kù),也具有強(qiáng)大的數(shù)據(jù)分析可視化功能。Python于R的側(cè)重點(diǎn)略有不同,R的主要功能是數(shù)據(jù)分析和可視化,且功能強(qiáng)大,多數(shù)分析都可以由R提供的函數(shù)實(shí)現(xiàn),不需要太多的編程,代碼簡(jiǎn)單,容易上手。Python的側(cè)重點(diǎn)則是編程,具有很好的普適性,但數(shù)據(jù)分析并不是其側(cè)重點(diǎn),雖然從理論上說(shuō)都可以實(shí)現(xiàn),但往往需要編寫(xiě)很長(zhǎng)的代碼,幫助功能也不夠強(qiáng)大,這對(duì)數(shù)據(jù)分析的初學(xué)者來(lái)說(shuō)可能顯得麻煩,但仍然不失為一種有效的數(shù)據(jù)分析工具

1.1

統(tǒng)計(jì)學(xué)與數(shù)據(jù)分析數(shù)據(jù)分析方法與工具——軟件分類(lèi)數(shù)據(jù)(data)數(shù)據(jù)是個(gè)廣義的概念,任何可觀測(cè)并有記錄的信息都可以稱為數(shù)據(jù),它不僅僅包括數(shù)字,也包括文本、圖像等。比如,一篇文章也可以看作數(shù)據(jù),一幅照片也可以視為數(shù)據(jù),等等本書(shū)使用的數(shù)據(jù)概念則是狹義的,僅僅是指統(tǒng)計(jì)變量的觀測(cè)結(jié)果。因此,要理解數(shù)據(jù)的概念,需要先清楚變量的概念變量的觀測(cè)結(jié)果變量(variable)描述所觀察對(duì)象某種特征的概念每次的觀察結(jié)果可能不同如,“企業(yè)銷(xiāo)售額”、“上漲股票的家數(shù)”、“生活費(fèi)支出”、“投擲一枚骰子出現(xiàn)的點(diǎn)數(shù)”等就是變量

1.2

變量、數(shù)據(jù)及其分類(lèi)變量和數(shù)據(jù)數(shù)據(jù)是變量的觀測(cè)結(jié)果,因此,數(shù)據(jù)的分類(lèi)與變量的分類(lèi)是相同的本書(shū)混合使用變量和數(shù)據(jù)這兩個(gè)概念在講述分析方法時(shí)多使用變量的概念,在例題分析中多使用數(shù)據(jù)的概念了解變量或數(shù)據(jù)的分類(lèi)十分必要,因?yàn)椴煌淖兞炕驍?shù)據(jù)適用的分析方法是不同的變量分類(lèi)類(lèi)別變量(定性)無(wú)序類(lèi)別變量(名義值)有序類(lèi)別變量(順序值)布爾變量(二值)數(shù)值變量(定量)離散變量(離散值)連續(xù)變量(連續(xù)值)時(shí)間變量(定性或定量)定性:離散值定量:連續(xù)值

1.2

變量、數(shù)據(jù)及其分類(lèi)變據(jù)(變量)的分類(lèi)間接來(lái)源——二手?jǐn)?shù)據(jù)直接來(lái)源——抽取樣本總體(population):包含所研究的全部個(gè)體(或數(shù)據(jù))的集合樣本(sample):從總體中抽取的一部分元素的集合樣本量(samplesize):構(gòu)成樣本的元素的數(shù)目概率抽樣方法根據(jù)已知的概率抽取樣本元素,也稱隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有放回抽樣和無(wú)放回抽樣分層抽樣將總體單位按某種特征或規(guī)則劃分為不同層,再?gòu)牟煌膶又须S機(jī)地抽取樣本系統(tǒng)抽樣將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本元素整群抽樣將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,再對(duì)中選群中的所有單位全部實(shí)施調(diào)查

1.3

數(shù)據(jù)的來(lái)源直接來(lái)源和間接來(lái)源第

1步:在Excel工作表界面中點(diǎn)擊【文件】

【選項(xiàng)】第

2步:在彈出的對(duì)話框中選擇【加載項(xiàng)】,并在“加載項(xiàng)”下選擇【分析工具庫(kù)】第3步:點(diǎn)擊【轉(zhuǎn)到】,出現(xiàn)的界面如下圖所示。選中需要的加載宏,單擊【確定】,即可完成安裝

1.4

數(shù)Excel【數(shù)據(jù)分析】工具的安裝直接Excel【數(shù)據(jù)分析】工具的安裝(2019版)描述應(yīng)用推斷思維導(dǎo)圖本書(shū)基本框架本書(shū)基本框架數(shù)據(jù)來(lái)源和分類(lèi)第1章統(tǒng)計(jì)和數(shù)據(jù)數(shù)據(jù)處理第2章數(shù)據(jù)處理描述分析可視化分析第3章數(shù)據(jù)可視化統(tǒng)計(jì)量分析第4章數(shù)據(jù)的描述統(tǒng)計(jì)量推斷分析理論基礎(chǔ)第5章統(tǒng)計(jì)量及其概率分布估計(jì)方法第6章參數(shù)估計(jì)檢驗(yàn)方法第7章假設(shè)檢驗(yàn)其他方法關(guān)系分析第8章相關(guān)與回歸分析時(shí)間序列第9章時(shí)間序列分析和預(yù)測(cè)THANKSTHEEND2025/4/10THEENDTHANKS數(shù)據(jù)分析提取信息從數(shù)據(jù)中賈俊平2025/4/10統(tǒng)計(jì)學(xué)—基于Excel(第4版)21世紀(jì)統(tǒng)計(jì)學(xué)系列教材課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他方法使用軟件Excel學(xué)分與課時(shí)

2或3學(xué)分,1~17周,每周2或3課時(shí)課程簡(jiǎn)介賈俊平2025/4/102.1數(shù)據(jù)的預(yù)處理2.2生成頻數(shù)分布表2.3數(shù)值數(shù)據(jù)類(lèi)別化第2章數(shù)據(jù)處理問(wèn)題與思考在你的生活或工作中接觸過(guò)數(shù)據(jù)嗎?如果接觸過(guò),都是些什么樣的數(shù)據(jù)?這些數(shù)據(jù)對(duì)你有用嗎?如果將2000個(gè)家庭的調(diào)查問(wèn)卷交給你處理,你首先會(huì)做什么?如何將500個(gè)學(xué)生的調(diào)查問(wèn)卷數(shù)據(jù)匯總在一張表格里?如果按收入的多少將家庭分成低收入、中等收入和高收入,你會(huì)怎么做?數(shù)據(jù)審核就是檢查數(shù)據(jù)中是否有錯(cuò)誤對(duì)于通過(guò)調(diào)查取得的原始數(shù)據(jù)(rawdata),主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目是否填寫(xiě)齊全等。準(zhǔn)確性審核主要是檢查數(shù)據(jù)是否有錯(cuò)誤,是否存在異常值等對(duì)于通過(guò)其他渠道取得的二手?jǐn)?shù)據(jù),應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性應(yīng)弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料,以便確定這些數(shù)據(jù)是否符合自己分析研究的需要,不能盲目生搬硬套還要對(duì)數(shù)據(jù)的時(shí)效性進(jìn)行審核,對(duì)于有些時(shí)效性較強(qiáng)的問(wèn)題,如果所取得的數(shù)據(jù)過(guò)于滯后,可能失去了研究的意義

2.1

數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核與錄入——數(shù)據(jù)審核數(shù)據(jù)錄入就是生成電子數(shù)據(jù)文件用Excel進(jìn)行數(shù)據(jù)驗(yàn)證第1步:用鼠標(biāo)在工作表中選定錄入數(shù)據(jù)的單元格區(qū)域,如A1:B10單元格區(qū)域第2步:選擇【數(shù)據(jù)】→【數(shù)據(jù)驗(yàn)證】第3步:在【驗(yàn)證條件】的【允許】框內(nèi)選擇要錄入的數(shù)據(jù)類(lèi)型,比如,“整數(shù)”(默認(rèn)為任何值)。在【介于】框內(nèi)選擇驗(yàn)證條件,或者在“最小值”和“最大值”框內(nèi)輸入數(shù)據(jù)范圍。比如,在【最小值】框內(nèi)輸入0,在【最大值】框內(nèi)輸入100。出現(xiàn)的界面如下圖所示第4步:點(diǎn)擊【出錯(cuò)警告】,在【式樣】下選擇“警告”,在【錯(cuò)誤信息】下輸入警告信息,比如“NA”。然后點(diǎn)擊【確定】,即可完成設(shè)置完成上述設(shè)置后,在此區(qū)域內(nèi)錄入不符合驗(yàn)證條件的數(shù)據(jù)將會(huì)出現(xiàn)以下錯(cuò)誤信息。比如,在A1單元格錄入1000,顯示的錯(cuò)誤信息。選擇【是】,忽略此錯(cuò)誤,選擇【否】則返回單元格,再重新錄入

2.1

數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核與錄入——數(shù)據(jù)錄入

2.1

數(shù)據(jù)的預(yù)處理數(shù)據(jù)排序和篩選——數(shù)據(jù)排序【例2-1】表2-1是50個(gè)學(xué)生的學(xué)生編號(hào)、性別、專(zhuān)業(yè)和考試分?jǐn)?shù)數(shù)據(jù)。按考試分?jǐn)?shù)降序排列第1步:將光標(biāo)放在數(shù)據(jù)區(qū)域的任意單元格。然后點(diǎn)擊【數(shù)據(jù)】

【排序】第2步:在【主要關(guān)鍵字】框中選擇要排序的變量,本例為“考試分?jǐn)?shù)”,在【次序】中選擇降序(默認(rèn)為升序),然后點(diǎn)擊【確定】(如果要專(zhuān)業(yè)排序,點(diǎn)擊【選項(xiàng)】,在【方法】下選中“字母排序”或“筆劃排序”)

2.1

數(shù)據(jù)的預(yù)處理學(xué)生編號(hào)性別專(zhuān)業(yè)考試分?jǐn)?shù)學(xué)生編號(hào)性別專(zhuān)業(yè)考試分?jǐn)?shù)1男會(huì)計(jì)學(xué)8226男管理學(xué)782男金融學(xué)8127女金融學(xué)893女會(huì)計(jì)學(xué)7528男會(huì)計(jì)學(xué)794女管理學(xué)8629女金融學(xué)845男會(huì)計(jì)學(xué)7730女會(huì)計(jì)學(xué)986女金融學(xué)9731女會(huì)計(jì)學(xué)797男管理學(xué)7732女金融學(xué)768女會(huì)計(jì)學(xué)9233男會(huì)計(jì)學(xué)799女金融學(xué)7134男會(huì)計(jì)學(xué)5610男會(huì)計(jì)學(xué)8535女會(huì)計(jì)學(xué)8811女金融學(xué)8036女會(huì)計(jì)學(xué)8612男金融學(xué)5537男管理學(xué)7913男管理學(xué)8138男管理學(xué)8514男會(huì)計(jì)學(xué)7839男管理學(xué)7315男會(huì)計(jì)學(xué)5140女會(huì)計(jì)學(xué)7916女金融學(xué)7941男金融學(xué)8217男會(huì)計(jì)學(xué)6342男管理學(xué)8218男管理學(xué)8943男管理學(xué)7419女管理學(xué)7144女金融學(xué)8320男金融學(xué)8245女金融學(xué)7421男管理學(xué)9146女管理學(xué)8622男金融學(xué)9047男管理學(xué)7523女管理學(xué)7848男會(huì)計(jì)學(xué)7024男金融學(xué)7449女會(huì)計(jì)學(xué)7325男金融學(xué)6650女會(huì)計(jì)學(xué)80數(shù)據(jù)排序和篩選——數(shù)據(jù)排序——例題分析數(shù)據(jù)篩選(datafilter)是根據(jù)需要找出符合特定條件的某類(lèi)數(shù)據(jù)

2.1

數(shù)據(jù)的預(yù)處理用Excel進(jìn)行數(shù)據(jù)篩選的過(guò)程【例2-2】篩選出考試分?jǐn)?shù)大于等于90的學(xué)生第1步:將光標(biāo)放在數(shù)據(jù)區(qū)域的任意單元格。然后點(diǎn)擊【數(shù)據(jù)】

【篩選】。這時(shí)繪在每個(gè)變量名中出現(xiàn)下拉箭頭第2步:點(diǎn)擊要篩選的變量的下拉箭頭即可對(duì)該變量進(jìn)行篩選。比如,要篩選出考試分?jǐn)?shù)大于等于90的學(xué)生,點(diǎn)擊考試分?jǐn)?shù)變量的下拉箭頭第3步:點(diǎn)擊“大于或等于”,并在后面的框內(nèi)輸入90。點(diǎn)擊【確定】數(shù)據(jù)排序和篩選——數(shù)據(jù)篩選——例題分析

2.1

數(shù)據(jù)的預(yù)處理【例2-2】篩選出會(huì)計(jì)學(xué)專(zhuān)業(yè)考試分?jǐn)?shù)小于60男生—使用【高級(jí)篩選】命令第1步:在工作表的上方插入3個(gè)空行,將數(shù)據(jù)表的第一行(變量名)復(fù)制到第1個(gè)空行;在第2個(gè)空行的相應(yīng)變量名下依次輸入篩選的條件第2步:選擇【數(shù)據(jù)】→【高級(jí)】。在列表區(qū)域輸入要篩選的數(shù)據(jù)區(qū)域;在條件區(qū)域輸入條件區(qū)域單擊【確定】數(shù)據(jù)排序和篩選——數(shù)據(jù)排序——例題分析數(shù)據(jù)抽樣(datasampling)是從一個(gè)已知的總體數(shù)據(jù)集中抽取隨機(jī)樣本。在實(shí)際應(yīng)用中,可以使用不同統(tǒng)計(jì)軟件抽取一個(gè)簡(jiǎn)單隨機(jī)樣本。下面通過(guò)一個(gè)例子說(shuō)明用Excel的【數(shù)據(jù)分析】工具抽取隨機(jī)樣本的過(guò)程

2.1

數(shù)據(jù)的預(yù)處理用Excel進(jìn)行數(shù)據(jù)篩選的過(guò)程【例2-3】沿用例2-1。隨機(jī)抽取10個(gè)不同專(zhuān)業(yè)的學(xué)生組成一個(gè)樣本第1步:在工作表中點(diǎn)擊【數(shù)據(jù)】

【數(shù)據(jù)分析】。第2步:在彈出的對(duì)話框中選擇【抽樣】。單擊【確定】。第3步:在出現(xiàn)的對(duì)話框【輸入?yún)^(qū)域】中輸入要抽取一般的數(shù)據(jù)區(qū)域(本例中為學(xué)生代碼所在的區(qū)域);在【抽樣方法】中單擊【隨機(jī)】;在【樣本數(shù)】中輸入需要抽樣的樣本量(本例為20);在【輸出區(qū)域】中選擇抽樣結(jié)果放置的區(qū)域。單擊【確定】學(xué)生編號(hào)性別專(zhuān)業(yè)考試分?jǐn)?shù)26男管理學(xué)7815男會(huì)計(jì)學(xué)5116女金融學(xué)7911女金融學(xué)8037男管理學(xué)7925男金融學(xué)6649女會(huì)計(jì)學(xué)736女金融學(xué)9740女會(huì)計(jì)學(xué)7938男管理學(xué)85數(shù)據(jù)抽樣——例題分析產(chǎn)生正態(tài)分布隨機(jī)數(shù)第1步:將光標(biāo)放在任意空白單元格。然后點(diǎn)擊【數(shù)據(jù)】

【數(shù)據(jù)分析】第2步:在彈出的對(duì)話框中選擇【隨機(jī)數(shù)發(fā)生器】,單擊【確定】第3步:在【變量個(gè)數(shù)】中如要產(chǎn)生隨機(jī)變量的個(gè)數(shù);在【隨機(jī)數(shù)個(gè)數(shù)】框中輸入要產(chǎn)生隨機(jī)數(shù)的個(gè)數(shù);在【分布】框中選擇要產(chǎn)生隨機(jī)數(shù)的分布;在【標(biāo)準(zhǔn)偏差】框內(nèi)輸入正態(tài)分布的標(biāo)準(zhǔn)差(默認(rèn)為1);在【輸出選項(xiàng)】下選擇輸出隨機(jī)數(shù)的放置位置(默認(rèn)為新作表組。單擊【確定】,即可產(chǎn)生隨機(jī)數(shù)產(chǎn)生均勻分布隨機(jī)數(shù)在【變量個(gè)數(shù)】中輸入要產(chǎn)生隨機(jī)變量的個(gè)數(shù);在【隨機(jī)數(shù)個(gè)數(shù)】框中輸入個(gè)數(shù)數(shù)字;在【分布】框中選擇“均勻”;在【參數(shù)】下的【介于】框后輸入1和100(默認(rèn)是0~1);在【輸出選項(xiàng)】下選擇輸出隨機(jī)數(shù)的放置位置(默認(rèn)為新作表組);單擊【確定】

2.1

生成隨機(jī)數(shù)生成隨機(jī)數(shù)頻數(shù)(frequency)落在某一特定類(lèi)別(或組)中的數(shù)據(jù)個(gè)數(shù)頻數(shù)分布(frequencydistribution)把各個(gè)類(lèi)別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格形式表現(xiàn)出來(lái)由于類(lèi)別數(shù)據(jù)本身就是用文字表達(dá)的類(lèi)別,因此,只要先把所有的類(lèi)別都列出來(lái),然后計(jì)算出每一類(lèi)別的頻數(shù),即可生成一張頻數(shù)分布表頻數(shù)分布表中落在某一特定類(lèi)別的數(shù)據(jù)個(gè)數(shù)就是頻數(shù)根據(jù)觀察變量的多少,可以生成簡(jiǎn)單頻數(shù)表、二維列聯(lián)表和多維列聯(lián)表等簡(jiǎn)單的頻數(shù)表也稱為一維列聯(lián)表只涉及一個(gè)分類(lèi)變量時(shí),這個(gè)變量的各類(lèi)別(取值)可以放在頻數(shù)分布表中“行”的位置,也可以放在“列”的位置,將該變量的各類(lèi)別及其相應(yīng)的頻數(shù)列出來(lái)

2.2

生成頻數(shù)分布表類(lèi)別數(shù)據(jù)的頻數(shù)分布表——簡(jiǎn)單頻數(shù)表【例2.5】沿用例2-1。分別制作學(xué)生性別和專(zhuān)業(yè)的簡(jiǎn)單頻數(shù)表用Excel生成頻數(shù)分布表的步驟第1步:選擇【插入】→【數(shù)據(jù)透視表】第2步:在【表/區(qū)域】框內(nèi)選定數(shù)據(jù)區(qū)域(在操作前將光標(biāo)放在任意數(shù)據(jù)單元格內(nèi),系統(tǒng)會(huì)自動(dòng)選定數(shù)據(jù)區(qū)域)。選擇放置數(shù)據(jù)透視表的位置。系統(tǒng)默認(rèn)是新工作表,如果要將透視表放在現(xiàn)有工作表中,選擇【現(xiàn)有工作表】,并在【位置】框內(nèi)點(diǎn)擊工作表的任意單元格(不要覆蓋數(shù)據(jù))。點(diǎn)擊【確定】第3步:用鼠標(biāo)右鍵單擊數(shù)據(jù)透視表,選擇【數(shù)據(jù)透視表選項(xiàng)】,在彈出的對(duì)話框中點(diǎn)擊【顯示】,并選中【經(jīng)典數(shù)據(jù)透視表布局】,然后【確定】第4步:將數(shù)據(jù)透視的一個(gè)字段拖至“行”位置,將“另一個(gè)字段”拖至“列”的位置(行列可以互換),再將要計(jì)數(shù)的變量拖至“值字段”位置,即可生成需要的頻數(shù)分布表

2.2

生成頻數(shù)分布表類(lèi)別數(shù)據(jù)的頻數(shù)分布表——簡(jiǎn)單頻數(shù)表——例題分析二維列聯(lián)表(contingencytable)也稱為交叉表(crosstable)涉及兩個(gè)分類(lèi)變量時(shí),通常將一個(gè)變量的各類(lèi)別放在“行”的位置,另一個(gè)變量的各類(lèi)別放在“列”的位置(行和列可以互換)生成頻數(shù)分布表,這樣表格就是列聯(lián)表【例2-5】例如沿用例2-1。將性別放在行的位置、專(zhuān)專(zhuān)業(yè)放在列的位置,制作一個(gè)二維列聯(lián)表

2.2

生成頻數(shù)分布表類(lèi)別數(shù)據(jù)的頻數(shù)分布表——二維列聯(lián)表——例題分析頻數(shù)表的分析統(tǒng)計(jì)量可以使用比例(proportion)、百分比(percentage)、比率(ratio)等統(tǒng)計(jì)量進(jìn)行描述。如果是有序類(lèi)別數(shù)據(jù),還可以計(jì)算累積百分比(CumulativePercent)進(jìn)行分析比例也稱構(gòu)成比,它是一個(gè)樣本(或總體)中各類(lèi)別的頻數(shù)與全部頻數(shù)之比,通常用于反映樣本(或總體)的構(gòu)成或結(jié)構(gòu)。將比例乘以100得到的數(shù)值稱為百分比,用%表示。比率是樣本(或總體)中各不同類(lèi)別頻數(shù)之間的比值,反映各類(lèi)別之間的比較關(guān)系。由于比率不是部分與整體之間的對(duì)比關(guān)系,因而比值可能大于1。累積頻數(shù)是將各有序類(lèi)別的頻數(shù)逐級(jí)累加的結(jié)果(注意:對(duì)于無(wú)序類(lèi)別的頻數(shù)計(jì)算累積頻數(shù)沒(méi)有意義),累積百分比則是將各有序類(lèi)別的百分比逐級(jí)累加的結(jié)果表2-7頻數(shù)表的分析

2.2

生成頻數(shù)分布表專(zhuān)業(yè)人數(shù)(人)百分比(%)累積人數(shù)(人)累積百分比(%)管理學(xué)1530.01530.0會(huì)計(jì)學(xué)1938.03468.0金融學(xué)1632.050100.0合計(jì)50100.0——類(lèi)別數(shù)據(jù)的頻數(shù)分布表——頻數(shù)表的簡(jiǎn)單分析——例題分析

2.3

數(shù)值數(shù)據(jù)類(lèi)別化數(shù)據(jù)分組生成數(shù)值數(shù)據(jù)的頻數(shù)分布表時(shí),需要先將其類(lèi)別化,即轉(zhuǎn)化為類(lèi)別數(shù)據(jù),然后再生成頻數(shù)分布表。類(lèi)別化的方法是將原始數(shù)據(jù)分成不同的組別數(shù)據(jù)分組是將數(shù)值數(shù)據(jù)轉(zhuǎn)化成類(lèi)別數(shù)據(jù)的方法之一,它是先將數(shù)據(jù)按照一定的間距劃分成若干個(gè)區(qū)間,然后再統(tǒng)計(jì)出每個(gè)區(qū)間的頻數(shù),生成頻數(shù)分布表【例2-6】

某電商平臺(tái)連續(xù)120天的銷(xiāo)售額數(shù)據(jù)如表所示。對(duì)銷(xiāo)售額做適當(dāng)分組,分析銷(xiāo)售額的分布特征

2.3

數(shù)值數(shù)據(jù)類(lèi)別化282207235193210227220215201196191246182205232263215227234248235208262206211216222247214226209206197249234258228227234244198209226206212191227228198209250210253208203217224213235245201182256218213182216229232230214244217209271217225217219248202171253262213226275232236206222264177210228215225228238243204181213248245219243236239216251213234210218220226233240253生成頻數(shù)分布表——例題分析

2.3

數(shù)值數(shù)據(jù)類(lèi)別化銷(xiāo)售額分組(萬(wàn)元)天數(shù)(天)頻率(%)170~18565.00185~20075.83200~2153025.00215~2303428.33230~2452117.50245~2601512.50260~27554.17275~29021.67合計(jì)120100.00銷(xiāo)售額分組(萬(wàn)元)天數(shù)(天)頻率(%)170~18021.67180~19043.33190~20075.83200~2101714.17210~2202722.50220~2302016.67230~2401613.33240~2501310.83250~26075.83260~27043.33270~28021.67280~29010.83合計(jì)120100.00生成分組表——例題分析思維導(dǎo)圖清理類(lèi)別化制表數(shù)據(jù)處理數(shù)據(jù)預(yù)處理數(shù)據(jù)審核與錄入數(shù)據(jù)排序和篩選數(shù)據(jù)抽樣生成隨機(jī)數(shù)生成頻數(shù)分布表簡(jiǎn)單頻數(shù)表二維列聯(lián)表頻數(shù)表的簡(jiǎn)單分析數(shù)值數(shù)據(jù)類(lèi)別化數(shù)據(jù)分組生成分組表數(shù)據(jù)處理與頻數(shù)分布THANKSTHEEND2025/4/10THEENDTHANKS數(shù)據(jù)處理頻數(shù)表頻數(shù)分布賈俊平2025/4/10統(tǒng)計(jì)學(xué)—基于Excel(第4版)21世紀(jì)統(tǒng)計(jì)學(xué)系列教材課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他方法使用軟件Excel學(xué)分與課時(shí)

2或3學(xué)分,1~17周,每周2或3課時(shí)課程簡(jiǎn)介賈俊平2025/4/103.1類(lèi)別數(shù)據(jù)可視化3.2數(shù)值數(shù)據(jù)可視化3.3時(shí)間序列可視化3.4可視化的注意事項(xiàng)第3章數(shù)據(jù)的可視化問(wèn)題與思考如果讓你看一個(gè)電商一個(gè)月每天的銷(xiāo)售額數(shù)據(jù),或者給你看這些數(shù)據(jù)的某個(gè)圖形,你會(huì)選擇哪種?將上市公司按行業(yè)分成金融業(yè)、地產(chǎn)業(yè),旅游業(yè)、其他行業(yè)4個(gè)部分,要觀察不同行業(yè)上市公司的個(gè)數(shù),你認(rèn)為應(yīng)該用什么樣的圖?如果要觀察不同行業(yè)上市公司的構(gòu)成,你認(rèn)為應(yīng)該用什么樣的圖?要反映應(yīng)一個(gè)地區(qū)的家庭收入分布狀況,你會(huì)使用什么圖形?要反映身高和體重的關(guān)系,你認(rèn)為該使用什么圖形?要比較兩個(gè)上市公司的銷(xiāo)售收入、凈利潤(rùn)、凈資產(chǎn)、負(fù)債4個(gè)指標(biāo)的差異和相似性,你會(huì)使用什么樣的圖形?條形圖(barplot)用一定長(zhǎng)度和寬度的矩形表示各類(lèi)別頻數(shù)多少的圖形,主要用于展示類(lèi)別數(shù)據(jù)的頻數(shù)分布,也可以用于展示帶有標(biāo)簽的數(shù)值數(shù)據(jù)繪制條形圖時(shí),各類(lèi)別可以放在x軸(橫軸),也可以放在y軸(縱軸)。類(lèi)別放在x軸的條形圖稱為垂直條形圖(verticalbarplot)或柱形圖,類(lèi)別放在y軸的條形圖稱為水平條形圖(horizontalbarplot)根據(jù)繪制的變量多少,條形圖有簡(jiǎn)單條形圖、簇狀(并列)條形圖和堆積(堆疊)條形圖等不同形式。條形圖的變種形式有瀑布圖、漏斗圖、樹(shù)狀圖等條形圖—簡(jiǎn)單條形圖和帕累托圖

3.1

類(lèi)別數(shù)據(jù)可視化【例3-1】為研究不同地區(qū)的消費(fèi)者對(duì)網(wǎng)上購(gòu)物的滿意度,隨機(jī)抽取東部、中部和西部的1000個(gè)消費(fèi)者進(jìn)行調(diào)查,得到的結(jié)果如表3-1所示。繪制條形圖分析各類(lèi)別的人數(shù)分布狀況滿意度東部中部西部總計(jì)非常滿意829383258比較滿意725276200一滿意513537123非常不滿意28251871總計(jì)3703253051000

3.1

類(lèi)別數(shù)據(jù)可視化條形圖—簡(jiǎn)單條形圖和帕累托圖帕累托圖(Paretoplot)各類(lèi)別的數(shù)值降序排列后繪制的條形圖,該圖是以意大利經(jīng)濟(jì)學(xué)家V.Pareto的名字命名的。帕累托圖可以看作簡(jiǎn)單條形圖的變種,利用該圖很容易看出哪類(lèi)頻數(shù)出現(xiàn)得最多,哪類(lèi)頻數(shù)出現(xiàn)得最少

3.1

類(lèi)別數(shù)據(jù)可視化條形圖—簡(jiǎn)單條形圖和帕累托圖簇狀條形圖和堆積條形圖根據(jù)兩個(gè)類(lèi)別變量的各類(lèi)別繪制條形圖時(shí),由于繪制方式的不同,有簇狀條形圖、堆積條形圖、百分比條形圖等條形圖—簇狀條形圖和堆積條形圖簇狀條形圖百分比條形圖堆積條形圖

3.1

類(lèi)別數(shù)據(jù)可視化瀑布圖(waterfallchart)瀑布圖(waterfallchart)是由麥肯錫顧問(wèn)公司獨(dú)創(chuàng)的一種圖形,因?yàn)樾嗡破俨剂魉妹F俨紙D可看作是條形圖的一個(gè)變種,其界面與條形圖十分形似,區(qū)別是條形圖不反映局部與整體的關(guān)系,而瀑布圖可以顯示多個(gè)子類(lèi)對(duì)總和的貢獻(xiàn),從而反映局部與整體的關(guān)系。比如,各個(gè)產(chǎn)業(yè)的增加值對(duì)GDP總額的貢獻(xiàn),不同地區(qū)的銷(xiāo)售額對(duì)總銷(xiāo)售額的貢獻(xiàn),等等

3.1

類(lèi)別數(shù)據(jù)可視化

瀑布圖和漏斗圖——瀑布圖漏斗圖(funnelplot)漏斗圖(funnelplot)因形狀類(lèi)似漏洞而得名,它是將各類(lèi)別數(shù)值降序排列后繪制的水平條形圖。漏斗圖適合于展示數(shù)據(jù)逐步減少的現(xiàn)象,比如,生產(chǎn)成本逐年減少等

3.1

類(lèi)別數(shù)據(jù)可視化瀑布圖和漏斗圖——漏斗圖餅圖(piechart)可視化各類(lèi)別頻數(shù)占所有類(lèi)別總頻數(shù)的百分比,餅圖是用圓形及圓內(nèi)扇形的角度來(lái)表示一個(gè)樣本(或總體)中各類(lèi)別的頻數(shù)占總頻數(shù)比例大小的圖形,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用餅圖和環(huán)形圖—餅圖

3.1

類(lèi)別數(shù)據(jù)可視化環(huán)形圖(

doughnutchart)環(huán)形圖與餅圖類(lèi)似,但又有區(qū)別。環(huán)形圖中間有一個(gè)“空洞”,每個(gè)樣本用一個(gè)環(huán)來(lái)表示,樣本中每一類(lèi)別的頻數(shù)構(gòu)成用環(huán)中的一段表示。因此,環(huán)形圖可展示多個(gè)樣本各類(lèi)別頻數(shù)占其相應(yīng)總頻數(shù)的比例,從而有利于構(gòu)成的比較研究餅圖和環(huán)形圖—環(huán)形圖

3.1

類(lèi)別數(shù)據(jù)可視化樹(shù)狀圖(

dendrogram

)當(dāng)有兩個(gè)或兩個(gè)以上類(lèi)別變量時(shí),可以將各類(lèi)別的層次結(jié)構(gòu)畫(huà)成樹(shù)狀的形式,稱為樹(shù)狀圖(dendrogram)或分層樹(shù)狀圖。樹(shù)狀圖有不同的表現(xiàn)形式,它可以看作是條形圖的一個(gè)變種,主要用來(lái)展示各類(lèi)別變量之間的層次結(jié)構(gòu)關(guān)系,尤其適合展示兩個(gè)及兩個(gè)個(gè)以上類(lèi)別變量的情形(也可以用于展示兩個(gè)類(lèi)別變量)。樹(shù)狀圖是將多個(gè)類(lèi)別變量的層次結(jié)構(gòu)繪制在一個(gè)表示總頻數(shù)(或其他總數(shù)值)的大的矩形中,每個(gè)子類(lèi)用不同大小的矩形嵌套在這個(gè)大的矩形中,嵌套矩形表示各子類(lèi)別的頻數(shù)(或其他數(shù)值),其大小與相應(yīng)的子類(lèi)頻數(shù)(或其他數(shù)值)呈正比。樹(shù)狀圖和旭日?qǐng)D——樹(shù)狀圖

3.1

類(lèi)別數(shù)據(jù)可視化旭日?qǐng)D(

sunburstchart)可以看作是餅圖的一個(gè)特殊變種,它實(shí)際上是多個(gè)環(huán)形圖的集合。當(dāng)數(shù)據(jù)集只有一個(gè)分層時(shí),旭日?qǐng)D就是環(huán)形圖。當(dāng)數(shù)據(jù)集有多個(gè)分層時(shí),旭日?qǐng)D是一種嵌套多層的環(huán)形圖,其中的每一個(gè)圓環(huán)代表同一級(jí)別的數(shù)據(jù)比例,離原點(diǎn)(圓心)越近的圓環(huán)級(jí)別越高,最內(nèi)層的圓環(huán)表示層次結(jié)構(gòu)的頂級(jí),稱為父層,向外的圓環(huán)級(jí)別依次降低,稱為子層。相鄰兩層中,是內(nèi)層包含外層的關(guān)系

3.1

類(lèi)別數(shù)據(jù)可視化樹(shù)狀圖和旭日?qǐng)D——旭日?qǐng)D直方圖(histogram

)用于展示數(shù)值數(shù)據(jù)分布的一種常用圖形,它是用矩形的寬度和高度(即面積)來(lái)表示頻數(shù)分布。通過(guò)直方圖可以觀察數(shù)據(jù)分布的大體形狀。。繪制直方圖時(shí),用橫軸表示數(shù)據(jù)的分組區(qū)間,縱軸表示各組的頻數(shù)或頻率,區(qū)間寬度和相應(yīng)的頻數(shù)畫(huà)出一個(gè)矩形,多個(gè)矩形并列起來(lái)就是直方圖。由于數(shù)據(jù)的分組是連續(xù)的,所以各矩形之間是連續(xù)排列,不能留有間隔展示數(shù)據(jù)分布—直方圖

3.2

數(shù)值數(shù)據(jù)可視化【例3-3】

150個(gè)網(wǎng)約車(chē)服務(wù)出租車(chē)某一天的營(yíng)業(yè)額數(shù)據(jù)。繪制直方圖分析營(yíng)業(yè)額的分布展示數(shù)據(jù)分布—直方圖

3.2

數(shù)值數(shù)據(jù)可視化

展示數(shù)據(jù)分布—箱形圖

3.2

數(shù)值數(shù)據(jù)可視化箱形圖的示意圖

3.2

數(shù)值數(shù)據(jù)可視化展示數(shù)據(jù)分布—箱形圖箱形圖對(duì)對(duì)應(yīng)的分布

3.2

數(shù)值數(shù)據(jù)可視化展示數(shù)據(jù)分布—箱形圖【例3-4】

5個(gè)學(xué)院30名學(xué)生考試分?jǐn)?shù)的箱形圖先將光標(biāo)放在任意數(shù)據(jù)單元格,然后點(diǎn)擊【插入】

【插入統(tǒng)計(jì)圖表】,選擇【箱形圖】,即可繪制出箱形圖根據(jù)需要再對(duì)圖形做必要的修改,比如,選擇不同的箱形圖式樣、更改坐標(biāo)軸刻度、添加坐標(biāo)軸標(biāo)題、添加箱形圖的頻數(shù)標(biāo)簽等

3.2

數(shù)值數(shù)據(jù)可視化展示數(shù)據(jù)分布—箱形圖

展示變量間關(guān)系—散點(diǎn)圖

3.2

數(shù)值數(shù)據(jù)可視化【例3-5】

2022年31個(gè)地區(qū)的人均地區(qū)生產(chǎn)總值(按當(dāng)年價(jià)格計(jì)算)、社會(huì)消費(fèi)品零售總額和地方財(cái)政一般預(yù)算支出。繪散點(diǎn)圖并觀察它們之間的關(guān)系

3.2

數(shù)值數(shù)據(jù)可視化展示變量間關(guān)系—散點(diǎn)圖氣泡圖(bubblechart)展示3個(gè)變量的關(guān)系。第3個(gè)變量數(shù)值的大小用圓的大小表示

3.2

數(shù)值數(shù)據(jù)可視化展示變量間關(guān)系—?dú)馀堇走_(dá)圖(radarchart)從一個(gè)點(diǎn)出發(fā),用每一條射線代表一個(gè)變量,多個(gè)變量的數(shù)據(jù)點(diǎn)連接成線,即圍成一個(gè)區(qū)域,多個(gè)樣本圍成多個(gè)區(qū)域,就是雷達(dá)圖,利用它也可以研究多個(gè)樣本之間的相似程度【例3-6】

2022年北京、天津、上海和重慶的居民人均消費(fèi)支出數(shù)據(jù)。繪制雷達(dá)圖,比較不同地區(qū)的人均各項(xiàng)消費(fèi)支出的特點(diǎn)和相似性

3.2

數(shù)值數(shù)據(jù)可視化展示樣本相似性—雷達(dá)圖支出項(xiàng)目北京天津上海重慶食品煙酒9223.29313.112653.08599.9衣著1860.81630.41716.71698.0居住17170.37468.117073.54782.7生活用品及服務(wù)2193.31789.02128.01656.6交通通信4129.33888.64529.23078.2教育文化娛樂(lè)3008.02546.03099.62585.0醫(yī)療保健3981.53555.53616.52350.5其他用品及服務(wù)1116.81132.91229.0620.2【例3-6】

2022年北京、天津、上海和重慶的居民人均消費(fèi)支出數(shù)據(jù)。繪制雷達(dá)圖,比較不同地區(qū)的人均各項(xiàng)消費(fèi)支出的特點(diǎn)和相似性

3.2

數(shù)值數(shù)據(jù)可視化展示樣本相似性—雷達(dá)圖平行坐標(biāo)圖(parallelcoordinateplot)也稱多線圖或輪廓圖(outlineplot),它是用橫坐標(biāo)表示各樣本,縱軸表示每個(gè)樣本的多個(gè)變量的取值,將不同樣本的同一個(gè)變量的取值用折線連接,即為平行坐標(biāo)圖

3.2

數(shù)值數(shù)據(jù)可視化展示樣本相似性—平行坐標(biāo)圖折線圖

3.3

時(shí)間序列可視化折線圖折線圖是描述時(shí)間序列最基本的圖形,它主要用于觀察和分析時(shí)間序列隨時(shí)間變化的形態(tài)和模式折線圖的x軸是時(shí)間,y軸是變量的觀測(cè)值在Excel工作表中單擊【插入】

【插入折線圖或面積圖】,選擇【二維折線圖】,即可繪制折線圖【例3-7】

2000年—2023年我國(guó)城鎮(zhèn)居民和農(nóng)村居民的人均消費(fèi)支出。繪制折線圖分析居民消費(fèi)水平的變化特征面積圖

3.3

時(shí)間序列可視化面積圖將折線與x軸之間的區(qū)域用顏色填充,填充的區(qū)域即為面積能更好地展示時(shí)間序列變化的特征和模式將多個(gè)時(shí)間序列繪制在一幅圖中時(shí),序列數(shù)不宜太多,否則圖形之間會(huì)有相互遮蓋,看起來(lái)會(huì)很亂。當(dāng)序列較多時(shí),可以將每個(gè)序列單獨(dú)繪制一幅圖【例3-7】

2000年—2023年我國(guó)城鎮(zhèn)居民和農(nóng)村居民的人均消費(fèi)支出。繪制折線圖分析居民消費(fèi)水平的變化特征

3.4

可視化的注意事項(xiàng)圖形標(biāo)題圖(a)中的問(wèn)題有兩個(gè),一是主標(biāo)題只有編號(hào),沒(méi)有內(nèi)容;二是沒(méi)有坐標(biāo)軸標(biāo)題。雖然表示類(lèi)別的x軸沒(méi)有標(biāo)題可以看懂,但y軸標(biāo)題是必須有的,否則就不知道這幅圖表達(dá)的是什么圖(b)中的問(wèn)題也有兩個(gè),一是主標(biāo)題沒(méi)有給出時(shí)間和地點(diǎn)信息,不知道是哪個(gè)地區(qū)的地區(qū)生產(chǎn)總值,也不知道是什么時(shí)間的地區(qū)生產(chǎn)總值;二是y軸標(biāo)題沒(méi)有計(jì)量單位,無(wú)法理解數(shù)據(jù)的含義圖(c)中的問(wèn)題同樣有兩個(gè),一是主標(biāo)題只給出了地區(qū)信息,但沒(méi)給出時(shí)間信息,不知道是什么時(shí)間的地區(qū)生產(chǎn)總值;二是y軸標(biāo)題沒(méi)有計(jì)量單位,同樣難以理解圖(d)是一幅完整的規(guī)范圖形,主標(biāo)題給出時(shí)間、地點(diǎn)和內(nèi)容信息,y軸標(biāo)題給出了計(jì)量單位,這樣的圖形就很容易理解

3.4

可視化的注意事項(xiàng)坐標(biāo)軸刻度起點(diǎn)在直角坐標(biāo)中繪制的二維圖形是由4個(gè)點(diǎn)構(gòu)成的一個(gè)矩形(當(dāng)然有些圖形也可以畫(huà)出正方形,如正態(tài)Q-Q圖),如果把x軸定義為寬度(width),y軸定義為高度(height),圖形寬度和高度的比例大致為10:7或4:3從視覺(jué)效果看,這樣的圖形比例能夠更合理地展示數(shù)據(jù),也易于對(duì)圖形的解讀,過(guò)寬或過(guò)高的圖形都有可能歪曲數(shù)據(jù),給人留下錯(cuò)誤的印象圖(a)的寬度和高度比例大約為10:7,比較真實(shí)地展示了發(fā)電量的變化趨勢(shì)。圖(b)的寬度和高度不成比例,寬度過(guò)寬,高度過(guò)低,這樣的圖形容易壓縮數(shù)據(jù)的變動(dòng),似乎發(fā)電量的上升趨勢(shì)不夠明顯。圖(c)的寬度和高度同樣不成比例,高度過(guò)高,寬度過(guò)窄,這樣的圖形容易放大數(shù)據(jù)的波動(dòng),使人看起來(lái)上升趨勢(shì)過(guò)于陡峭

3.4

可視化的注意事項(xiàng)圖形比例在直角坐標(biāo)中繪制的二維圖形是由4個(gè)點(diǎn)構(gòu)成的一個(gè)矩形(當(dāng)然有些圖形也可以畫(huà)出正方形,如正態(tài)Q-Q圖),如果把x軸定義為寬度(width),y軸定義為高度(height),圖形寬度和高度的比例大致為10:7或4:3從視覺(jué)效果看,這樣的圖形比例能夠更合理地展示數(shù)據(jù),也易于對(duì)圖形的解讀,過(guò)寬或過(guò)高的圖形都有可能歪曲數(shù)據(jù),給人留下錯(cuò)誤的印象圖(a)的寬度和高度比例大約為10:7,比較真實(shí)地展示了發(fā)電量的變化趨勢(shì)。圖(b)的寬度和高度不成比例,寬度過(guò)寬,高度過(guò)低,這樣的圖形容易壓縮數(shù)據(jù)的變動(dòng),似乎發(fā)電量的上升趨勢(shì)不夠明顯。圖(c)的寬度和高度同樣不成比例,高度過(guò)高,寬度過(guò)窄,這樣的圖形容易放大數(shù)據(jù)的波動(dòng),使人看起來(lái)上升趨勢(shì)過(guò)于陡峭思維導(dǎo)圖數(shù)據(jù)可視化類(lèi)別數(shù)據(jù)可視化展示絕對(duì)值條形圖瀑布圖漏斗圖展示百分比餅圖環(huán)形圖展示層次結(jié)構(gòu)樹(shù)狀圖旭日?qǐng)D數(shù)值數(shù)據(jù)可視化展示分布直方圖箱形圖展示關(guān)系散點(diǎn)圖氣泡圖展示相似性雷達(dá)圖平行坐標(biāo)圖時(shí)間序列可視化展示模式折線圖面積圖數(shù)值數(shù)據(jù)時(shí)間序列類(lèi)別數(shù)據(jù)數(shù)據(jù)類(lèi)型與圖表展示方法THANKSTHEEND2025/4/10THEENDTHANKS用圖形數(shù)據(jù)特征探索賈俊平2025/4/10統(tǒng)計(jì)學(xué)—基于Excel(第4版)21世紀(jì)統(tǒng)計(jì)學(xué)系列教材課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他方法使用軟件Excel學(xué)分與課時(shí)

2或3學(xué)分,1~17周,每周2或3課時(shí)課程簡(jiǎn)介賈俊平2025/4/104.1描述水平的統(tǒng)計(jì)量4.2描述差異的統(tǒng)計(jì)量4.3描述分布形狀的統(tǒng)計(jì)量4.4Excel【數(shù)據(jù)分析】工具的應(yīng)用第4章數(shù)據(jù)的描述統(tǒng)計(jì)量問(wèn)題與思考如果用一個(gè)值代表一個(gè)地區(qū)的收入水平,你是用平均數(shù)還是用中位數(shù)?“雙十一”每個(gè)人網(wǎng)購(gòu)金額的標(biāo)準(zhǔn)差是500元,平時(shí)是400元,你認(rèn)為是“雙十一”網(wǎng)購(gòu)金額的差異大,還是平時(shí)網(wǎng)購(gòu)金額的差異大?假定你們班的統(tǒng)計(jì)學(xué)平均考試分?jǐn)?shù)是80分,標(biāo)準(zhǔn)差是5分,而你的考試分?jǐn)?shù)是90分,你的考試分?jǐn)?shù)距離平均數(shù)有幾個(gè)標(biāo)準(zhǔn)差的距離?你可以手工計(jì)算30個(gè)人的平均上網(wǎng)時(shí)間,

但你能手工計(jì)算300萬(wàn)個(gè)人的平均上網(wǎng)時(shí)間嗎?

平均數(shù)

4.1

描述水平的統(tǒng)計(jì)量

簡(jiǎn)單平均數(shù)加權(quán)平均數(shù)【例4-1】隨機(jī)抽取20個(gè)年齡在18—25周歲之間的成年人,得到的身高數(shù)據(jù)如表4—1所示。計(jì)算20個(gè)人的平均身高簡(jiǎn)單平均數(shù)——例題分析

176165182174177170178174176169176165185175170180164179162173

4.1

描述水平的統(tǒng)計(jì)量【例4-2】沿用第2章例2-6。根據(jù)表2-10的分組數(shù)據(jù),計(jì)算銷(xiāo)售額的平均數(shù)加權(quán)平均數(shù)——例題分析

4.1

描述水平的統(tǒng)計(jì)量銷(xiāo)售額分組170~1801752350180~1901854740190~20019571365200~210205173485210~220215275805220~230225204500230~240235163760240~250245133185250~26025571785260~27026541060270~2802752550280~2902851285合計(jì)—12026870

分位數(shù)——中位數(shù)

4.1

描述水平的統(tǒng)計(jì)量

分位數(shù)——中位數(shù)——例題分析

162164165165169170170173174174175176176176177178179180182185

4.1

描述水平的統(tǒng)計(jì)量四分位數(shù)(quartile)一組數(shù)據(jù)排序后處于25%和75%位置上的數(shù)值。它是用3個(gè)點(diǎn)將全部數(shù)據(jù)等分為4部分,其中每部分包含25%的數(shù)據(jù)。很顯然,中間的四分位數(shù)就是中位數(shù),因此通常所說(shuō)的四分位數(shù)是指處在25%位置上和處在75%位置上的兩個(gè)位置有多種算法如果位置是整數(shù),四分位數(shù)就是該位置對(duì)應(yīng)的數(shù)值;如果是在整數(shù)加0.5的位置上,則取該位置兩側(cè)數(shù)值的平均數(shù);如果是在整數(shù)加0.25或0.75的位置上,則四分位數(shù)等于該位置前面的數(shù)值加上按比例分?jǐn)偟奈恢脙蓚?cè)數(shù)值的差值分位數(shù)——四分位數(shù)

4.1

描述水平的統(tǒng)計(jì)量

分位數(shù)——四分位數(shù)——例題分析

4.1

描述水平的統(tǒng)計(jì)量

分位數(shù)——百分位數(shù)

4.1

描述水平的統(tǒng)計(jì)量分位數(shù)——百分位數(shù)——例題分析

4.1

描述水平的統(tǒng)計(jì)量

眾數(shù)

4.1

描述水平的統(tǒng)計(jì)量水平統(tǒng)計(jì)量的適用場(chǎng)合平均數(shù)、分位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的幾個(gè)主要統(tǒng)計(jì)量,實(shí)際應(yīng)用中,用哪個(gè)統(tǒng)計(jì)量來(lái)代表一組數(shù)據(jù)的水平,取決于數(shù)據(jù)的分布特征平均數(shù)易被多數(shù)人理解和接受,實(shí)際中用得也較多,但其缺點(diǎn)是易受極端值的影響。當(dāng)數(shù)據(jù)的分布對(duì)稱或偏斜程度不是很大時(shí),應(yīng)選擇使用平均數(shù)對(duì)于嚴(yán)重偏度分布的數(shù)據(jù),平均數(shù)的代表性較差。由于中位數(shù)和眾數(shù)不受極端值的影響,因此,當(dāng)數(shù)據(jù)分布的偏斜程度較大時(shí),可以考慮選擇中位數(shù)或眾數(shù),這時(shí)它們的代表性要比平均數(shù)好各統(tǒng)計(jì)量的適用場(chǎng)合

4.1

描述水平的統(tǒng)計(jì)量極差(range)一組數(shù)據(jù)的最大值與最小值之差,也稱全距,用R表示計(jì)算公式為極差和四分位差

4.2

描述差異的統(tǒng)計(jì)量方差(variance)離差平方后再求平均數(shù)標(biāo)準(zhǔn)差(standarddeviation)方差開(kāi)方后的結(jié)果稱為標(biāo)準(zhǔn)差(standarddeviation)方差(或標(biāo)準(zhǔn)差)是實(shí)際中應(yīng)用最廣泛的測(cè)度數(shù)據(jù)離散程度的統(tǒng)計(jì)量方差和標(biāo)準(zhǔn)差樣本方差計(jì)算公式樣本標(biāo)準(zhǔn)差計(jì)算公式

4.2

描述差異的統(tǒng)計(jì)量【例4-7】

計(jì)算20個(gè)人身高的方差和標(biāo)準(zhǔn)差——簡(jiǎn)單方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差——例題分析

4.2

描述差異的統(tǒng)計(jì)量【例4-8】

沿用第2章例2-6。根據(jù)表2-10的分組數(shù)據(jù),計(jì)算銷(xiāo)售額的標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差——例題分析

4.2

描述差異的統(tǒng)計(jì)量營(yíng)業(yè)額分組17016644786.3328180~19018541514.76646059.0656190~2001957836.36645854.5648200~21020517357.96646085.4288210~2202152779.56642148.2928220~230225201.166423.328230~24023516122.76641964.2624240~25024513444.36645776.7632250~2602557965.96646761.7648260~27026541687.56646750.2656270~28027522609.16645218.3328280~29028513730.76643730.7664合計(jì)—120—55159.168離散系數(shù)(coefficientofvariation,CV)也稱變異系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比由于離散系數(shù)消除了數(shù)據(jù)取值大小和計(jì)量單位對(duì)標(biāo)準(zhǔn)差的影響,因而可以反映一組數(shù)據(jù)的相對(duì)離散程度計(jì)算公式為離散系數(shù)

【例4-9】

為分析不同行業(yè)上市公司每股收益的差異,在互聯(lián)網(wǎng)服務(wù)行業(yè)和機(jī)械制造行業(yè)各隨機(jī)抽取10家上市公司,得到某年度的每股收益數(shù)據(jù)如表4—4所示。比較兩類(lèi)上市公司每股收益的離散程度互聯(lián)網(wǎng)公司機(jī)械制造公司0.320.680.470.430.890.280.970.030.870.421.090.240.730.660.960.290.960.020.630.59統(tǒng)計(jì)量互聯(lián)網(wǎng)公司機(jī)械制造公司平均數(shù)0.7890.364標(biāo)準(zhǔn)差0.2470020.236606離散系數(shù)0.3130570.650015

4.2

描述差異的統(tǒng)計(jì)量標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)某個(gè)數(shù)據(jù)與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值設(shè)樣本數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)為z,計(jì)算公式為標(biāo)準(zhǔn)分?jǐn)?shù)

將一組數(shù)據(jù)化為標(biāo)準(zhǔn)化得分的過(guò)程稱為數(shù)據(jù)的標(biāo)準(zhǔn)化。式(4.13)也就是統(tǒng)計(jì)上常用的標(biāo)準(zhǔn)化公式,在對(duì)多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),常常需要對(duì)各變量的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,也就是把一組數(shù)據(jù)轉(zhuǎn)化成具有平均數(shù)為0、標(biāo)準(zhǔn)差為1的新的數(shù)據(jù)標(biāo)準(zhǔn)分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒(méi)有改變某個(gè)數(shù)值在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)據(jù)分布的形狀

4.2

描述差異的統(tǒng)計(jì)量【例4-10】

沿用例4-1。計(jì)算20個(gè)人身高的標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)——例題分析

身高標(biāo)準(zhǔn)分?jǐn)?shù)身高標(biāo)準(zhǔn)分?jǐn)?shù)1760.39981851.8390170-0.55971790.87951760.39981740.08001801.03941760.3998165-1.35931750.23991780.7196162-1.8390165-1.35931770.5597164-1.5192169-0.71961821.3593170-0.55971740.0800173-0.0800

4.2

描述差異的統(tǒng)計(jì)量經(jīng)驗(yàn)法則根據(jù)標(biāo)準(zhǔn)分?jǐn)?shù),可以判斷一組數(shù)據(jù)中是否存在離群點(diǎn)(outlier)經(jīng)驗(yàn)表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí),約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi);約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi);約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。可以想象,一組數(shù)據(jù)中低于或高于平均數(shù)3倍標(biāo)準(zhǔn)差之外的數(shù)值是很少的,也就是說(shuō),在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)幾乎包含了全部數(shù)據(jù),而在3個(gè)標(biāo)準(zhǔn)差之外的數(shù)據(jù)在統(tǒng)計(jì)上也稱為離群點(diǎn)標(biāo)準(zhǔn)分?jǐn)?shù)

4.2

描述差異的統(tǒng)計(jì)量

偏度系數(shù)

4.3

描述分布形狀的統(tǒng)計(jì)量

峰度系數(shù)

4.3

描述分布形狀的統(tǒng)計(jì)量用【數(shù)據(jù)分析】工具計(jì)算描述統(tǒng)計(jì)量第1步:將光標(biāo)放在任意空白單元格。然后點(diǎn)擊【數(shù)據(jù)】

【數(shù)據(jù)分析】。在分析工具中選擇【描述統(tǒng)計(jì)】。單擊【確定】。第2步:在【輸入?yún)^(qū)域】輸入原始數(shù)據(jù)所在的區(qū)域;在【輸出選項(xiàng)】中選擇結(jié)果的輸出位置;選擇【匯總統(tǒng)計(jì)】(其他選項(xiàng)可根據(jù)需要選擇)綜合輸出多個(gè)描述統(tǒng)計(jì)量

4.4

Excel【數(shù)據(jù)分析】工具的應(yīng)用互聯(lián)網(wǎng)公司統(tǒng)計(jì)量機(jī)械制造公司統(tǒng)計(jì)量平均0.789平均0.364標(biāo)準(zhǔn)誤差0.078109標(biāo)準(zhǔn)誤差0.074821中位數(shù)0.88中位數(shù)0.355眾數(shù)0.96眾數(shù)#N/A標(biāo)準(zhǔn)差0.247002標(biāo)準(zhǔn)差0.236606方差0.06101方差0.055982峰度-0.20382峰度-1.06272偏度-0.87636偏度-0.11929區(qū)域0.77區(qū)域0.66最小值0.32最小值0.02最大值1.09最大值0.68求和7.89求和3.64觀測(cè)數(shù)10觀測(cè)數(shù)10思維導(dǎo)圖數(shù)據(jù)分布特征與描述統(tǒng)計(jì)量數(shù)據(jù)的描述統(tǒng)計(jì)量描述水平平均數(shù)簡(jiǎn)單平均數(shù)加權(quán)平均數(shù)分位數(shù)中位數(shù)四分位數(shù)百分位數(shù)眾數(shù)描述差異極差和四分位差極差四分位差方差和標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差離散系數(shù)標(biāo)準(zhǔn)分?jǐn)?shù)描述分布形狀偏度系數(shù)峰度系數(shù)數(shù)值特征水平差異形狀THANKSTHEEND2025/4/10THEENDTHANKS概括數(shù)據(jù)特征度量賈俊平2025/4/10統(tǒng)計(jì)學(xué)—基于Excel(第4版)21世紀(jì)統(tǒng)計(jì)學(xué)系列教材課程內(nèi)容描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、其他方法使用軟件Excel學(xué)分與課時(shí)

2或3學(xué)分,1~17周,每周2或3課時(shí)課程簡(jiǎn)介賈俊平2025/4/105.1概率與隨機(jī)變量5.2隨機(jī)變量的概率分布5.3樣本統(tǒng)計(jì)量的概率分布第5章概率分布問(wèn)題與思考如果天氣預(yù)報(bào)說(shuō)明天降雨的概率是60%,你上班會(huì)帶雨傘嗎?某城市的小汽車(chē)是按搖號(hào)配售,如果你參加一個(gè)搖號(hào)周期的搖號(hào),結(jié)果只有兩種可能:搖中、沒(méi)搖中,搖中或沒(méi)搖中的概率分布是什么?你認(rèn)為全校學(xué)社的月生活費(fèi)支出數(shù)據(jù)的分布大概是什么形狀?從一個(gè)班級(jí)50個(gè)學(xué)生中隨機(jī)抽取10人組成一個(gè)樣本,

能抽取多少個(gè)這樣的樣本?

5.1

概率與隨機(jī)變量什么是概率

隨機(jī)變量及其概括性度量——隨機(jī)變量事先不知道會(huì)出現(xiàn)什么結(jié)果,一般用

X,Y,Z

來(lái)表示投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫(xiě)字樓,每平方米的出租價(jià)格一個(gè)消費(fèi)者對(duì)某一特定品牌飲料的偏好離散型隨機(jī)變量隨機(jī)變量X取有限個(gè)值或所有取值都可以逐個(gè)列舉出來(lái)以確定的概率取這些不同的值連續(xù)型隨機(jī)變量可以取一個(gè)或多個(gè)區(qū)間中任何值所有可能取值不可以逐個(gè)列舉出來(lái),而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)

5.1

概率與隨機(jī)變量隨機(jī)變量的概括性度量——離散型——期望值和方差

【例5-1】一家電腦配件供應(yīng)商聲稱,它所提供的配件100個(gè)中擁有次品的個(gè)數(shù)X及相應(yīng)的概率如表4-1所示。求該供應(yīng)商配件次品數(shù)的期望值和標(biāo)準(zhǔn)差次品數(shù)X=xi0123概率P(X=xi)

pi0.750.120.080.05

5.1

概率與隨機(jī)變量隨機(jī)變量的概括性度量——連續(xù)型——期望值和方差期望值方差

5.1

概率與隨機(jī)變量隨機(jī)變量的概率分布概率分布(probabilitydistribution):列出隨機(jī)變量能取哪些值及取這些值的概率要計(jì)算出某一事件發(fā)生的概率,就必須知道隨機(jī)變量分布的概率常用的離散型概率分布有二項(xiàng)分布(binomialdistribution)、泊松分布(Poissondistribution)和超幾何分布(hypergeometricdistribution)等連續(xù)型概率分布有正態(tài)分布(normaldistribution)、均勻分布(uniformdistribution)和指數(shù)分布(exponentialdistribution)等

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——離散型——二項(xiàng)分布二項(xiàng)分布建立在Bernoulli試驗(yàn)基礎(chǔ)上貝努里試驗(yàn)滿足下列條件一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗(yàn)“成功”的概率為p,失敗的概率為q=1-p,且概率p對(duì)每次試驗(yàn)都是相同的試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次在n次試驗(yàn)中,“成功”的次數(shù)對(duì)應(yīng)一個(gè)離散型隨機(jī)變量X

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——離散型——二項(xiàng)分布

期望值方差01230.750.120.080.05

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——離散型——二項(xiàng)分布——例題分析

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——離散型——二項(xiàng)分布——Excel應(yīng)用

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——連續(xù)型——正態(tài)分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值它取任何一個(gè)特定的值的概率都等于0不能列出每一個(gè)值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來(lái)描述常見(jiàn)的連續(xù)型概率分布有正態(tài)分布(normaldistribution)、均勻分布(uniformdistribution)和指數(shù)分布(exponentialdistribution)等正態(tài)分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來(lái)描述可用于近似離散型隨機(jī)變量的分布,如二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)概率密度函數(shù)

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——連續(xù)型——正態(tài)分布正態(tài)分布圖形是關(guān)于x=

對(duì)稱鐘形曲線,且峰值在x=

處均值

和標(biāo)準(zhǔn)差

一旦確定,分布形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值

可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。

越大,正態(tài)曲線扁平;

越小,正態(tài)曲線越高陡峭X的取值向橫軸左右兩個(gè)方向無(wú)限延伸,曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1不同均值和標(biāo)準(zhǔn)差對(duì)應(yīng)的正態(tài)曲線

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——連續(xù)型——標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)常用區(qū)間的正態(tài)概率

5.2

隨機(jī)變量的概率分布用Excel繪制標(biāo)準(zhǔn)正態(tài)分布概率密度函數(shù)曲線繪制標(biāo)準(zhǔn)正態(tài)分布概率密度函數(shù)曲線第1步:在工作表的第1列A3:A63輸入應(yīng)一個(gè)等差數(shù)列,初始值為“-3”,步長(zhǎng)為“0.1”,終值為“3”,作為標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)正態(tài)變量的值第2步:在單元格B1輸入標(biāo)準(zhǔn)正態(tài)變量的均值0,在單元格D1輸入標(biāo)準(zhǔn)正態(tài)變量的標(biāo)準(zhǔn)差1第3步:在單元格B3輸入公式“=A3*$D$1+$B$1”,并將其復(fù)制到B4:B63區(qū)域,作為未作標(biāo)準(zhǔn)化變換的正態(tài)變量的值第4步:在單元格C3輸入公式“=NORMDIST(B3,$B$1,$D$1,0)”,并將其復(fù)制到C4:C63區(qū)域,作為與B4:B63區(qū)域正態(tài)變量的值相對(duì)應(yīng)的正態(tài)分布概率密度函數(shù)的結(jié)果第5步:將B3:B63作為橫坐標(biāo)、C3:C63作為縱坐標(biāo),繪制折線圖

5.2

隨機(jī)變量的概率分布隨機(jī)變量的概率分布——連續(xù)型——正態(tài)分布——概率計(jì)算

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——卡方分布

不同自由度的的卡方分布的圖像

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——卡方分布——例題分析

函數(shù)語(yǔ)法參數(shù)的含義返回結(jié)果CHISQ.DISTCHISQ.DIST(x,Deg_freedom,cumulative)左尾概率CHISQ.DIST.RTCHISQ.DIST(x,Deg_freedom)同上右尾概率CHISQ.INVCHISQ.INV(probability,Deg_freedom)CHISQ.INV.RTCHISQ.INV.RT(probability,Deg_freedom)同上

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——t分布

T分布與標(biāo)準(zhǔn)正態(tài)分布曲線的比較

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——t分布——例題分析

t分布函數(shù)的參數(shù)含義及返回結(jié)果函數(shù)語(yǔ)法參數(shù)的含義返回結(jié)果T.DISTT.DIST(X,Deg_freedom,cumulative)左尾概率T.DIST.RTT.DIST.RT(X,Deg_freedom)同上右尾概率T.DIST.2TT.DIST.2T(X,Deg_freedom)同上雙尾概率T.INVT.INV(probabilityDeg_freedom)probability為t分布的雙尾概率左尾t值T.INV.2TT.INV.2T(probabilityDeg_freedom)同上雙尾t值

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——F分布

不同自由度的F分布

5.2

隨機(jī)變量的概率分布其他幾個(gè)重要的統(tǒng)計(jì)分布——連續(xù)型——F分布——例題分析

F分布函數(shù)的參數(shù)含義及返回結(jié)果函數(shù)語(yǔ)法參數(shù)的含義返回結(jié)果F.DISTF.DIST(x,Deg_freedom1,Deg_freedom2,cumulative)x為F值,Deg_freedom1為分子自由度,Deg_freedom2為分母自由度,cumulative為邏輯值,累積分布函數(shù)使用TRUE,概率密度函數(shù)使用FAL

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論