SPC-基本統計最基礎_第1頁
SPC-基本統計最基礎_第2頁
SPC-基本統計最基礎_第3頁
SPC-基本統計最基礎_第4頁
SPC-基本統計最基礎_第5頁
已閱讀5頁,還剩60頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

BasicStatistic基本統計學2/5/2023數據的分類2/5/2023什么是數據數據是來自觀察的,由一個過程所搜集得來的數據可讓我們描繪過程,了解過程,改善過程甚至控制過程.Data數據驅動決策和行動2/5/2023數據在過程改善中的重要性InGodwetrust我們只相信上帝所有其他人請拿出數據來2/5/2023兩種主要數據類型(類項數據)(測量數據)(名目型)(連續型)(順序型)(計數型)離散數據變量數據2/5/2023練習一請標出下列數據的類型,A代表計數型數據,V代表計量型數據

顧客平均消費,電話待機時間

產品是否合格職員-Tom,Nancy,Howard.

支出與預算相符

輸入支出費用的時間2/5/2023答案

顧客平均消費,電話待機時間

v

產品是否合格A

職員-Tom,Nancy,Howard.A

4)支出與預算相符A5)輸入支出費用的時間v數據類型(VorA)2/5/2023小組討論(練習二)計量型數據

計量型數據的益處?

計量型數據的缺點?計數型數據計數型數據的益處?計數型數據的缺點?2/5/2023小組討論–答案計量型數據益處:1.能夠為使用相對小范圍抽樣的過程提供詳細的信息2.適用于低缺陷率3.能夠預估發展趨勢和情況缺點:1.通常較難得到數據2.分析更為復雜2/5/2023小組討論–答案計量型數據益處:容易得到數據,并且計算方法簡單2.數據容易理解3.數據隨時可得缺點:1.無法顯示缺陷怎樣發生及過程如何變化2.不適合低缺陷率(需要大量的抽樣)3.不能預測發展趨勢和情況2/5/2023數據類型比較計量型數據計數型數據連續數據計數數據通常為正態分布通常為二項式分布或泊松分布實際數值合格/不合格實際定義嚴謹數據定義較差需少量抽樣需大量抽樣2/5/2023

知識水平1.沒有數據,也沒有經驗–只有觀點2.沒有數據–只有經驗3.收集了數據-但只是看數字有多少4.分組的數據-圖表5.描述性統計數據–中數、標準差等等6.推理性統計–預測過程績效:能力分析,回歸和實驗計劃法2/5/2023轉化計數型數據如可以,將計數型數據轉換為計量型數據能增加它的功能。計數型數據計量型數據轉換為2/5/2023VariableData計量型數據2/5/2023計量型數據–學習目的完成此階段學習后,學員能夠Ⅰ利用數據的分布形狀,中央趨勢和變異大小進行特性化Ⅱ

如果數據是正態分布的,計算z數值,利用Z數值表確定超出某一數值的比例2/5/2023離散數據與連續數據連續數據的優點:離散=稀少的信息連續=豐富的信息2/5/2023統計學基本術語Population總體

想要測量對象的全部Parameter參數用總體的所有數據計算出的數值(如均值,

標準差),稱為總體的參數x參數總體平均值總體標準差總體σ2/5/2023統計學基本術語Sample樣本從總體抽出的部分數據Statistics統計量用樣本的所有數據計算出的數值(如均值,

標準差),稱為樣本的統計量x統計量樣本平均值樣本標準差s總體樣本2/5/2023統計學基本術語Population總體已制造或將要制造對象的全體集合,用所關注的特性描述我們究竟能否知道真正的整體參數?Sample樣本

統計研究中實際測量的目標組樣本通常是整體的子集Σ=整體標準差S=樣本標準差Population整體sample樣本2/5/2023描述計量型數據集“報告上司:河水深度1.6M,士兵平均高度1.7M,過河沒有問題”,但是..至于我們不能只看平均值,還需要利用其他統計量來分析……2/5/2023描述計量型數據集一組計量型數據能顯示以下3個特性:CentralTendency(Mean,Median,Mode)中央趨勢(均值,中值,眾數)Variable(range,StandardDeviation,Variance)變異(全距,標準差,方差)Shape形狀2/5/2023參數和統計量符號Mean均值Variance方差StandardDeviation標準差Proportion比例總體(參數)μσσπ樣本(統計量)

хs2sp2/5/2023位置測量(CentralTendency)中心趨勢Mean均值Median中值Mode眾數Quartiles四分值2/5/2023樣本均值若樣本(樣本量為n)的觀測值為x1,x2,…xn,則樣本均值為:

類似地,一個有著大量但限個(N個)觀測值的總體,其總體均值為:Mean均值2/5/2023Mean均值練習三10個連接線的拉拔強度為:

230240236248252278265262拉拔強度的均值是多少?10個觀測值的均值為:2/5/2023Mean均值練習四199X年一個行動中,戰機進行了3000次戰斗,總共用時6900小時。那末每次戰斗平均用時多少?每次戰斗平均用時為:注意所使用的符號2/5/2023

均值的特性均值的計算使用了每個觀測值;每個觀測值對均值都有影響。所有觀測值對均值的偏差的總和為零。均值對極端的觀測值很敏感,極端值會導致均值向他偏移。Xxxxxxx6351274△6△2△42/5/2023Median中值

將一組觀測值按大小順序排列,位于中心的數值即為中值

若觀測值的個數為偶數,則中值為中間2個數值的平均若觀測值的個數為奇數,則位于中心的數值即中值2/5/2023Median中值樣本中值

假如x(1),x(2),…,x(n))是按大小排序的樣本值,則樣本中值為:中值的優點是不受極端大或極端小的觀測值的影響。2/5/2023Median中值練習五假設一個樣本觀測值為:

3124786

樣本均值和樣本中值是多少?這2個值是測量數據中心趨勢的合理指標嗎?2/5/2023Median中值(b)假如最后一個數值改變為:

3124782680

則樣本平均值和樣本中值是多少?

據此你有何結論?2/5/2023Median中值MedianvsMean中值與均值

因為中值不象均值對極端值敏感,因此,當有極端大或極端小值時,中值比均值更能代表數據的位置典型的例子是一個城市居民的收入中位值2/5/2023中值有時會有欺騙性50%-50%Rule?一半一半準則?

以下一組數據的中值是多少?

2,2,2,2,2,2,90可以用一半一半準則嗎?2/5/2023Mode眾數眾數是樣本中出現次數最多的觀測值。眾數可以是唯一的,也可以有不止一個,有時并不存在眾數。2/5/2023Mode眾數練習六如果樣本觀測值為:(a)691358134613110136913581346131106256134372681眾數是什么?具有一個眾數,兩個眾數或多于兩個眾數分布的數據分布叫什么?(單峰分布…)2/5/2023Mode眾數為何使用眾數?

當觀測值為分類式(如名義數據,序列數據)時.眾數是描述數據位置的最好的指標.典型的例子是,一個公司內員工收入的眾數眾數的重要信息當眾數不止1個時,從中抽取樣本的總體通常是多個總體的混合2/5/2023均值、中值、眾數的比較MOMeMeMO正態分布偏上分布偏下分布MOMe≥≥MOMe==MOMe≤≤2/5/2023Quartiles四分值

將一組按大小順序排列的數據平均分為四部分,分界點即四分值.

第一四分值(低四分值),約25%的觀測值小于它.第二四分值,約50%的觀測值小于它,即中值.第三四分值(高分值),約75%的觀測值小于它.2/5/2023Quartiles四分值練習七

以下為20個電燈泡失效期間的觀測值,已按遞增順序排列.2102162523003664546247208169241216129613921488154224802856319235283710請確定三個四分值.計算方法:先確定位置再計算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/42/5/2023Quartiles四分值答案

Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75則:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.52/5/2023Quartiles四分值2/5/2023散布的測量(變異)Range極差Variance方差StandardDeviation標準差Inter-QuartileRange四分植極差2/5/2023Range極差樣本極差為樣本中最大和最小觀測值之間的差別,即:極差是測量數據散布或變異的最簡單的方法但它忽略了最大和最小值之間的所有信息r=xmax-xmin2/5/2023Range極差試考慮以下的2個樣本:{102050607090}and{10,40,40,40,90}具有相同的極差(r=80)但是,第二個樣本的變異只是2個極端數值的變異,而在第1個樣本,中間的數值也有相當大的變異.當樣本量較小(n≤10)時,極差丟失信息的問題不是很嚴重2/5/2023方差與標準差若x1,x2,…,xn是一個具有N個觀測值的樣本,則樣本方差為:樣本標準差是樣本方差的算術平方根,即:2/5/2023方差計算練習八:計算下列觀測值的方差和標準差.305070901101302/5/2023方差計算ixixi-x(xi-x)2130-502500250-30900370-101004901010051103090061305025002/5/2023方差與標準差再考慮以下2個樣本.SampleA:102050607090SampleB:104040

40

4090

SampleASampleBRange極差8080Variance方差????StandardDeviation標準差????2/5/2023方差與標準差類似于樣本方差S2,用總體的所數據計算出總體變異—總體方差(σ2)總體的標準差(σ)是總體方差的算術平方根

對于包含N個數值的有限總體,其方差為:

σ2=2/5/2023方差特性

方差計算使用了所有觀測值,每個觀測值對方差都有影響

方差對極端值很敏感,因平方的緣故,極端大的觀測值會嚴重的放大方差。2/5/2023四分值極差

四分值極差是測量散布的另一指標:IQR=Q3-Q1

四分值極差不如極差對極端值敏感當分布顯著不對稱時,用它衡量散布會更好樣本(10,20,50,60,90)和(10,40,40,40,90)的四分值極差分別是40和0.2/5/2023TheNormalDistribution正態分布正態分布是一種具有特定的、非常有用的特性的數據分布

這些特性對我們理解所研究之過程的特性十分有用大部分自然現象和人造過程是正態分布或可有正態分布描述2/5/2023TheNormalDistribution正態分布特性1

:只需知道下述兩項參數就可完整描述正態分布均值標準差分布1分布2分布3此三項正態分布有何區別?2/5/2023正態曲線和概率特性2

:曲線下面的面積可用來估算某一特定事件發生的累積概率得到在兩個值之間的某個價值的累積概率99.73%95%68%離均值的標準差數目樣本值的概率40%-30%-20%-10%-0%-2/5/2023標準差的經驗規則

當一組數據不是最理想正態分布時,前述累積概率規則仍可應用比較理論(理想)正態分布和經驗(現實)分布NumberofStandardDeviations標準差數目TheoreticalNormal理論正態EmpiricalNormal經驗正態+/-1σ68%60-75%+/-2σ95%90-98%+/-3σ99.7%99-100%2/5/2023正態分布特點-3σ-2σ-1σ1σ2σ3σ68%95%99.73%StandardDeviation標準差σAverage標準差2/5/2023長期和短期能力(Z-偏差)ZLT=ZST-1.5

Sigma水平短期DPMO長期DPMO1158655.3691462.52

22750.1308537.53

1350.0

66807.24

31.7

6209.75

0.3

232.76

0.0018

3.42/5/2023正態分布鑒于許多過程輸出都是呈正態分布,所以可以用正態曲線的特點預測過程對象總體.即使非正態數據也能轉化為正態數據,所以正態曲線的特點仍然可以用來做預測2/5/2023正態曲線下的區域分析過程能力時,我們運用正態曲線下的區域預測超過規格界限的產品所占的比例.5%5%規格上限USL規格下限LSL2/5/2023標準正態分布標準正態分布,也叫Z分布,有下列參數:Z代表距離均值的標準差的數量μ=0

σ=1

-4σ

-3σ

-2σ

-1σ

μ

1σ2σ

2/5/2023Z代表從均值到能在達到(容納)多少個標準差

-4σ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論