




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Excel-箱線圖(數據分布)分析 標簽: excel數據分析六西格瑪箱線圖數據分布 2014-01-18 11:13 25396人閱讀 評論(0) 收藏 舉報 分類: Excel(14) 網站分析(9) 版權聲明:本文為博主原創文章,未經博主允許不得轉載。目錄(?)+本文摘自作者網站數據分析:數據驅動的網站管理、優化和運營 :箱線圖(Boxplot)也稱箱須圖(Box-whisker Plot),它是用一組數據中的最小值、第一四分位數、中位數、第三四分位數和最大值來反映數據分布的中心位置和散布范圍,可以粗略地看出數據是否具有對稱性。通過將多組數據的箱線圖畫在同一坐標上,則可以清晰地顯示各組數
2、據的分布差異,為發現問題、改進流程提供線索。1什么是四分位數箱線圖需要用到統計學的四分位數(Quartile)的概念,所謂四分位數,就是把組中所有數據由小到大排列并分成四等份,處于三個分割點位置的數字就是四分位數。· 第一四分位數(Q1),又稱“較小四分位數”或“下四分位數”,等于該樣本中所有數值由小到大排列后第25%的數字。· 第二四分位數(Q2),又稱“中位數”,等于該樣本中所有數值由小到大排列后第50%的數字。· 第三四分位數(Q3),又稱“較大四分位數”或“上四分位數”,等于該樣本中所有數值由小到大排列后第75%的數字。· 第三四分位數與第一四分
3、位數的差距又稱四分位間距(InterQuartile Range,IQR)。計算四分位數首先要確定Q1、Q2、Q3的位置(n表示數字的總個數):· Q1的位置=(n+1)/4· Q2的位置=(n+1)/2· Q3的位置=3(n+1)/4對于數字個數為奇數的,其四分位數比較容易確定。例如,數字“5、47、48、15、42、41、7、39、45、40、35”共有11項,由小到大排列的結果為“5、7、15、35、39、40、41、42、45、47、48”,計算結果如下:· Q1的位置=(11+1)/4=3,該位置的數字是15。· Q2的位置=(11+
4、1)/2=6,該位置的數字是40。· Q3的位置=3(11+1)/4=9,該位置的數字是45。而對于數字個數為偶數的,其四分位數確定起來稍微繁瑣一點。例如,數字“8、17、38、39、42、44”共有6項,位置計算結果如下:· Q1的位置=(6+1)/4=1.75· Q2的位置=(6+1)/2=3.5· Q3的位置=3(6+1)/4=5.25這時的數字以數據連續為前提,由所確定位置的前后兩個數字共同確定。例如,Q2的位置為3.5,則由第3個數字38和第4個數字39共同確定,計算方法是:38+(39-38)×3.5的小數部分,即38+1×
5、;0.5=38.5。該結果實際上是38和39的平均數。同理,Q1、Q3的計算結果如下:· Q1 = 8+(17-8)×0.75=14.75· Q3 = 42+(44-42)×0.25=42.5Excel為計算四分位數提供了QUARTILE(array,quart)函數,其中array參數用于指定要計算四分位數值的數組或數值型單元格區域,quart指定返回哪一個四分位值,可用值如下:· 0,返回最小值;· 1,返回第一個四分位數;· 2,返回第二個四分位數,即中位數;· 3,返回第三個四分位數;· 4,返回
6、最大值。2箱線圖的結構箱線圖包括一個矩形箱體和上下兩條豎線,箱體表示數據的集中范圍,上下兩條豎線分別表示數據向上和向下的延伸范圍,結構如圖9-51所示。圖9-51箱線圖的結構四分位間距框的頂部線條是第三四分位數的位置,即Q3,表示有75%的數據小于等于此值。底部線條是第一四分位數的位置,即Q1,表示有25%的數據小于此值。則整個四分位間距框所代表的是數據集中50%(即75%-25%)的數據,四分位間距框的高度就是這些數據涉及的范圍,能夠表現出數據的集中程度。Q2是數據中位數的位置。Whisker上限是延伸至距框頂部1.5倍框高范圍內的最大數據點,Whisker下限是延伸至距框底部1.5倍框高范
7、圍內的最小數據點,超出Whisker上限或下限的數值將使用星號“*”表示。但是,在Excel中繪制箱線圖需要借助股價圖來實現,因此無法展現異常值,Whisker上限將延伸至數據最大值的位置,Whisker下限將延伸至數據最小值的位置。3繪制箱線圖圖9-52中的A2:F8區域和H2:M8區域分別是華北和華南是某段時間客戶訂單收貨天數的統計結果,C11:C15和J11:J15是利用QUARTILE函數計算的華北、華南收貨天數的四分位數結果。圖9-52收貨天數的四分位數計算結果在Excel中繪制箱線圖需要借助股價圖的“開盤-盤高-盤底-收盤”圖來實現。根據Excel繪圖時放置數據系列的位置,開盤、盤
8、高、盤底、收盤應分別對應Q1、Q0、Q2、Q4。下面是繪圖步驟:· 準備圖表數據。根據對應關系,在表格的B18:E18區域分別輸入華北客戶的Q1、Q0、Q2、Q4統計數字,將Q3輸入到最后的F18單元格中,在A18中輸入一個日期型數據(注意,必須為日期型),如“2013/1/1”。然后在第19行中輸入華南客戶的數據,A19中的日期遞增1天,最終結果如圖9-53所示。圖9-53準備圖表數據· 插入圖表。選定A18:E19區域,在“插入”功能區的“圖表”模塊中單擊“其他圖表”,選擇股價圖部分的“開盤-盤高-盤底-收盤圖”按鈕,即可看到繪制的股價圖,如圖9-54所示。圖9-54插
9、入股價圖· 添加Q3數據系列。由圖9-54可以看出,四分位間距框的頂部線條使用的是Q4(最大值)位置,而是不是箱線圖要求的Q3位置。右擊繪圖區,在彈出的快捷菜單中選擇“選擇數據”命令,打開“選擇數據源”對話框。單擊“添加”按鈕打開“編輯數據系列”對話框,在“系列名稱”折疊框中輸入“Q3”,在系列值折疊框中選擇F18:F19區域,單擊“確定”按鈕即可看到股價圖變成了箱線圖,如圖9-55所示。四分位間距框的高度小了很多,單擊頂部線條與Whisker上限交匯處,可以看到使用的是Q3數據。圖9-55 添加Q3數據系列· 顯示中位數線。至此,四分位間距框雖然已經繪制正確了,但是還缺少中位數線,即Q2。選擇圖例中的“系列3”標簽,然后單擊鼠標右鍵,在彈出的快捷菜單中選擇“設置數據系列格式”命令,打開“設置數據系列格式”對話框。在“數據標記選項”中將標記類型設置為內置的“-”形狀,單擊“關閉”按鈕即可看到中位線顯示了出來,如圖9-56所示。圖9-56顯示中位數線· 美化圖表。首先要修改分類軸(橫軸)標簽,由于插入股價圖時的限制在A18和A19單元格中輸入了日期型數據,但是在圖表插入后,可以將其修改為其他數據類型的值,因此在A18和A19單元格分別輸入“華北”、“華南”。其次是刪除圖例欄,對于箱線圖而言這并不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 八年級地理上冊 第四章 中國的經濟發展 第一節 交通運輸 第2課時 我國鐵路干線的分布教學設計 (新版)新人教版
- 3學會自我保護 (公開課一等獎創新教學設計)統編版道德與法治七年級下冊
- 2創新永無止境 公開課一等獎創新教學設計(表格式)-1
- UTF-8‘’Brand KPIs for ready-made-food Aunt Bessie's in the United Kingdom-外文版培訓課件(2025.2)
- 微量泵使用與護理
- 案例分析1人感染高致病性禽流感疫情52
- 收藏品質押借款合同
- 倉庫租賃買賣合同樣本
- 軟件開發合同技術創新目標
- 《探求知識的互聯互通》課件
- 2025年山東省春季高考語文模擬試卷試題(含答案解析)
- 2024版《糖尿病健康宣教》課件
- DB11∕T 686-2023 透水磚路面施工與驗收規范
- 山東虛擬電廠商業模式介紹
- 醫療技術臨床應用管理培訓課件
- 敏捷開發管理咨詢合同
- 病區安全管理新護士上崗前培訓課件
- 汽車調光玻璃行業專題報告(技術路徑、市場空間、競爭格局等)-2024-08-零部件
- 老年人血脂異常管理中國專家共識(2022版)
- GB/T 44127-2024行政事業單位公物倉建設與運行指南
- 工裝裝修合同電子版
評論
0/150
提交評論