




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣及樣本容量(Sampling&SampleSize)什么是抽樣及為何要進行抽樣?抽樣是收集所有數據的一部分。使用該部分數據得出結論(進行推論)。為什么要進行抽樣?因為查看所有數據可能成本太高。費時太長。造成破壞(例如、品嘗測試)。一般可從比較少量的數據得出可靠的結論。總體情況:在操作上您可以定義現存的總體的邊界、以便可以認出總體的每個個體、在理論上還可以進行編號。抽樣目的:
描述該總體的特征。
示例:抽樣調查(8月31日以前畢業的)大學校友、以確定在今后兩年中他們至少將一個小孩送進大學的百分比。總體和過程樣本使用樣本對總體進行推論:例如。平均值=X、比例=p過程情況:過程是動態的且不斷變化的;過程中的個體并不是全可以鑒定的、因為某些個體尚不存在(如明天制造的那些個體)。目的:了解過程、以便采取行動改進或預測過程未來的行為。示例:我們估計下月發票中有5%至20%有錯誤(除非更改該過程)。總體和過程(續)使用樣本對過程未來的行為進行推論昨天保存時間順序!今天明天??20%5%10%15%抽樣數據的時間曲線圖???以時間順序排列的過程輸出抽樣和改進項目確定過程周期和缺陷比率的基準性能;(例如:在控制圖上繪出樣本數據)估計過程能力;(例如:計算一件樣本中的缺陷)確定造成性能低下或數據變動的因素(X);(利用樣本數據繪制圖表、進行假設測試或回歸分析)驗證建議的改進工作;(比較從過程中抽取的新數據與從該過程抽取的舊數據)監視過程性能、必要時采取補救措施、并預測未來的性能;(在控制圖上繪出新過程的樣本數據)改進項目一般是對過程情況進行抽樣:為什么要區別總體抽樣和過程抽樣?樣本容量公式是為定義明確的靜態(而且常常是理論上的)總體情況設計的。但是大多數抽樣應用是針對動態的、尚未知的過程情況。將樣本容量公式應用于過程抽樣情況可能得出錯誤的結論、除非滿足一定的條件。要使推論有效、樣本必須真實地代表總體或過程。總體所需的抽樣策略不同于過程所需的抽樣策略、以確保樣本具有代表性(在下一節中討論)。從穩定的過程中抽樣如果過程是穩定的、樣本容量公式可應用于過程情況。可獲得具有特定精度的可靠估計值。當進行比較時、如果存在的差異具有一定功效、便可找出它們。(穩定的、可預測的過程)4045505560651357911131517192123252729313335373941從不穩定的過程中抽樣然而許多過程是不穩定的。無論如何總要收集數據、并繪制控制圖或時間曲線圖。識別特殊原因并清除之。使用樣本容量公式求出的值是您應認為最小的數字;可能的話,需要收集更多的數據。存在特殊原因時,需要更大的樣本容量,因為長期變動大于短期變異。使用公式時,您必須估計s(或
p);您必須判斷特殊原因如何影響該估計值,并根據您認為過程將會是什么情況來調整它。從不穩定的過程中抽樣(續)當進行組之間的比較時:盡量在相同時間內獲取每組的樣本。當作結論或報告結論時、會存在這樣一個風險、即這些結論可能不適用于將來。如果過程是不穩定的,可能的話,將一段很長的時間里得到的數據繪制于一張控制圖上,并圈出或特別標示您的樣本所代表的數據點或時間區間。允許您和他人可直接從曲線觀察過程的行為。幫助您判斷這些結論在未來的可靠性。從過程中抽樣對于過程情況,我們希望確保能夠理解過程的行為。因此我們:在一段時間內進行系統或整群(非隨機)抽樣。即使隨機抽樣能適用于穩定過程,我們仍采用系統或整群抽樣,并保持時間順序以便能更好地表示過程行為。盡量從足夠長的時間段中進行抽樣,以便真實地表示過程中的變化源。運用您自己的判斷和有關變化源的過程知識來確定多長時間進行一次抽樣(每隔10個個體、每隔7個個體、每天、每月等)。一般情況下、更加頻繁地收集小樣本、可確保隨著時間的過去能真實地表示過程行為。繪制控制圖或時間曲線圖,以確定該過程是穩定的還是不穩定的(尋找非正常值、偏移、趨勢或其它模式)。抽樣方法代表性樣本要使結論有效效,樣本必須須具有代表性性。數據應真實地地表示總體或或過程收集的數據與與未收集的數數據之間不應應存在有系統統性的差異。。每個單元具有有相同被選中中的機會從每個組隨機機抽樣一個成成比例的數字字隨機抽樣分層隨機抽樣樣本總體體樣本本總體體AABBBBCDDDAAAABBBBBBBCCDDDDDDB概率率抽抽樣樣每隔隔n個抽抽樣樣((如如每每隔隔三三個個抽抽樣樣))每經經過過時時間間t抽樣樣n個單單元元((例例如如,,每每小小時時抽抽樣樣三三個個單單元元));然后后計計算算每每個個小小組組的的平平均均值值((比比例例))系統統抽樣樣整群群抽樣樣樣本總體
或過程保持時間順序樣本過程9:009:3010:3010:00保持時間順序統計計調調查查的的誤誤差差((抽抽樣樣誤誤差差))::是是指指調調查查所所得得結結果果與與總總體體真真實實數數值值之之間間的的差差異異。。可分分1、登登記記性性誤誤差差::指指在在調調查查和和匯匯總總過過程程中中,,由由于于觀觀察察、、測測量量、、登登記記、、計計算算等等方面面的的差差錯錯或或被被調調查查者者提提供供虛虛假假資資料料而而造造成成的的誤誤差差。。(不不是是抽抽樣樣調調查查獨獨有有的的))[盡量量避避免免]2、代代表表性性誤誤差差::指指用用樣樣本本指指標標推推斷斷總總體體指指標標時時,,由由于于樣樣本本結結構構與與總總體體結結構構不一一致致、、樣樣本本不不能能完完全全代代表表總總體體而而產產生生的的誤誤差差。。它它又又分分--2-1、系系統統誤誤差差::指指由由于于非非隨隨機機因因素素引引起起的的樣樣本本代代表表性性不不足足而而產產生生的的誤誤差差,,表現現為為樣樣本本估估計計量量的的值值系系統統性性偏偏高高或或偏偏低低,,故故也也稱稱偏偏差差,,[盡量量避避免免]如抽抽樣樣框框與與目目標標總總體體不不一一致致、、有有意意多多選選較較好好或或較較差差的的單單位位等等;;--2-2、隨隨機機誤誤差差::又又稱稱偶偶然然性性誤誤差差,,指指遵遵循循隨隨機機抽抽樣樣原原則則,,由由于于隨隨機機因因素素(偶偶然然性性因因素素))引引起起的的代代表表性性誤誤差差。。[不可可避避免免,,但但需需加加以以計計算算與與控控制制]抽樣樣估估計計中中所所謂謂的的抽抽樣樣誤誤差差,,就就是是指指這這種種隨隨機機誤誤差差,,即由于于抽樣樣的隨隨機性性而產產生的的樣本本估計計量與與總體體參數數之間間的代代表性性誤差差。抽樣誤誤差抽樣誤誤差的的3個概念念1、實際際抽樣樣誤差差:θ-θθ[實際上上總體體參數數θ是未知知數,,不可可計算算]2、抽樣樣平均均誤差差:3、抽樣樣極限限誤差差:是是指在在一定定的概概率下下抽樣樣誤差差的可可能范范圍,,也稱為為允許許誤差差。用用△表表示抽抽樣極極限誤誤差,,即在在一定定概率率下,,抽樣誤誤差率率=(抽樣樣極限限誤差差/估計量量)*100%抽樣估估計精精度=100%-抽樣誤誤差率率如|xxbar-X|≤△△xbar抽樣總總結本單元元包括括:抽樣是是查看看所有有數據據的一一種有有效率率和效效果的的方法法。總體抽抽樣與與過程程抽樣樣有不不同的的目的的和方方法。。代表性性是抽抽樣最最重要要的一一方面面。正確抽抽樣使使您對對結論論有信信心。。總體抽抽樣的的樣本本容量量公式式可適適用于于穩定定過程程。樣本容容量(SampleSize))樣本容容量介介紹人們常常問的的第一一個問問題是是“我我需要要多少少個樣樣本??”該問題題的答答案由由下列列四個個因素素確定定:1.數據類類型離散數數據和和連續續數據據2.您想做做什么么描述整整組的的某個個特征征(平平均值值或比比例))在特定定的精精度內內(±___單位))比較組組的特特征((找出出組平平均值值或比比例之之間的的差異異)以什么么功效效:希希望檢檢測到到特定定差異異的概概率3.您估計計的標標準偏偏差((或比比例))為多多大4.您希望望的置置信度度為多多高((通常常為95%)假設檢檢驗中中樣本本容量量的重重要性性當樣本本容量量太小小不能檢檢驗出出差異異n=1n=5過程A過程A過程B過程B假設檢檢驗中中樣本本容量量的重重要性性當樣本本容量量太大大對平均均值的的漂移移過于于敏感感資源浪浪費樣本容容量的的選取取過程程第一步步:明明確研研究過過程中中的響響應變變量第二步步:選選擇合合適的的統計計檢驗驗第三步步:決決定可可接受受的風風險和第四步步:定定出漂漂移敏敏感度度第五步步:建建立或或估計計當前前過程程中的的參數數第六步步:決決定合合適的的樣本本容量量抽樣風風險是H0成立,但但結果果卻否否定它它的風風險.1-是H0的置信信系數數.觀察值1抽樣風風險是H0不成立,但結結果卻肯肯定它的的風險.(1-)稱為檢驗驗的功效,它表示H0不成立,而結結果也否否定它的的概率,即當當H0不成立時時,作出出正確結結論的概概率.觀察值值12漂移抽樣風險險抽樣風險險H0:無差異H1:有明顯差差異零假設成立不成立決策接受H0拒絕H0正確1–正確1–第一類錯誤第二類錯誤
漂移敏感感性實驗之前前需要預預先指定定反映明明顯差異異的量.與標準差差之比/稱為漂移移敏感度度(driftsensitivity).關于均值值的比較較的檢驗驗單樣本檢檢驗(1-SampleTests)StatPowerandSampleSize1-SampleZStatPowerandSampleSize1-Samplet雙樣本檢檢驗(2-SampleTests)StatPowerandSampleSize2-Samplet樣本容量量公式取取決于您您的目的的抽樣目的的公式*/Minitab命令估計平均均值(例如、確確定基準準周期))(其中d=精度:±__單位)估計比例例(例如、確確定缺陷陷基準百百分比)(其中d=精度:±__單位)精度(d)精度是允允許某個個特征的的估計值值波動的的范圍。。估計上下下不超過過兩天的的周期。。估計上下下不超過過3%的缺陷百百分比。。使用符號號d表示精度度。傳統的統統計學稱稱它為“delta”、、因此以d表示。精度等于于置信區區間(CI)的一半。。周期(單單位為天天)為95%時CI=(48、52)意味著我我們有95%的確確信平均均周期在在48天至至52天之之間。CI的寬度=4天。。精度=d=2天(=估計值上上下不超超過2天)。精度(d)(續)決定您需要多多大的精度。。精度與樣本容容量的平方根根成反比。精度和樣本容容量要提高精度、、必須增加樣樣本容量(但但會增加成本本)。對于需要多大大的精度沒有有明確的答案案;該答案取決于于使用該估計計值對業務產產生多大的影影響。每種情況都是是獨特的;不不要效仿別人人的決定。估計平均值所所需的樣本容容量95%的置置信度*意味著因子為為2標準偏差的估估計您希望的精度度不重復抽樣重復抽樣目的:練習使使用樣本容量量公式估計平平均值。時間:3分鐘。要求:使用樣本容量量公式計算平平均值,以便回答下列列問題。1.假設您想估計計呼入電話的平平均通話時間間1分鐘鐘。您需要多多少樣本?(歷史數據顯示示典型的標準準偏差=3分鐘。)2.您需要對多少少次呼入抽樣樣、以獲得1/8分分鐘的精度??[練習]:估計平均均值所需的樣樣本容量練習:答案問題1.問題2.如何估計標準準偏差困難的選擇::要估計樣本容容量,您需要要知道標準偏偏差。您需對數據的的變化量有一一定了解,因因為數據可變變性加大,需要的樣本容容量也要相應應增加。但是,如果您您還沒有進行行抽樣,如何何知道偏差呢呢???如何估計標準準偏差(續))估計標準偏差差的選擇查找現存的數數據并計算s。使用類似過程程的控制圖((針對個體的的)。采集一個小的的樣本并計算算s。根據您對過程程的認識和記記得的類似數數據猜一猜(大多數人不擅擅長這樣做))。估計比例所需需的樣本容量量95%的置置信度意味著因子為為2猜p的值(樣本大小隨P變動較大、從從P=0.1到0.5,變化化甚劇)您希望的精度度使用精度調整整樣本容量您可使用確定定樣本容量的的公式,來確確定是否需要要花更多的資資金收集更多多的樣本來得得到更高的精精度。在收集集數據之前這這樣做可以幫幫助您決定多多少樣本可以以符合您的項項目和預算。。1.確定您可以提提供多少個樣樣本(n)。2.然后問:該樣本提供多多高的精度??即、精度的平平均值在±d單位之內還是精度的比比例在±d%之內使用精度調整整樣本容量((續)3. 該精度度足夠精確嗎嗎?4.如果不夠精確確:為各種樣本容容量繪制一個個精度和成本本表,以確定定在樣本上每每花一美元在在精度上提高高了多少。然后選擇一個個樣本容量,,再根據所提提高的精度或或您需要的精精度來證明這這是正確的選選擇。從有限的總體體中進行抽樣樣樣本容量公式式假設樣本容容量(n)小于總體(N)。如果>.05您抽取的樣本本占總體的5%以上您可以使用““有限總體””公式調整樣樣本容量:使用樣本容量量公式使用樣本容量量公式:在置信度為95%的的情況下,根根據給定的期期望精度以及及S或P的估計值,確定估計整組組的某個特征征(平均值或或比例)所需需的樣本容量量。在收集數據之前,確定各種樣本本容量其估計計值的精度。。確定估計值的精度度與增加樣本容量量的成本之間的得失。。在收集數據之后,確定估計值的的精度。狀態:樣本容容量命令和公公式抽樣目的公式*/Minitab命令估計平均值(例如、確定基基準周期)(其中d=精度:±__單位)估計比例(例如、確定缺缺陷基準百分分比)(其中d=精度:±__單位)比較兩組平均均值、找出差差異(2個樣本的的t測試)統計>功效和樣本容容量>2個樣本的t比較兩個以上上的組的平均均值、找出差差異(ANOVA)統計>功效和樣本容容量>單向ANOVA比較兩個((或更多))組的比例、找出差差異(卡方測試)統計>功效和樣本本容量>2個比例樣本容量大大經驗法則則統計值或圖表建議應采用用的最小小樣本容量量(n)平均值比例頻率分布圖圖(直方圖)Pareto排列圖散布圖控制圖505024245個變量α、β、δ、σ和N之間的關系系可寫出下下面是公式式:注意如果我我們知道了了5個變量量中的任意意4個變量量,就可以以通過上式式計算出第第5個變量量利用Minitab,我們現在將將說明如何何計算樣本本容量和檢檢驗功效::樣本容量=N檢驗功效=1-β計算樣本容容量一種新型的的焊接機已已經研制出出來,出于于對經濟價價值的考慮慮,新型焊焊接機的合格率必須要比現有類型型的焊接機機大5個百百分點,現現有設備的的合格率約為80%為了比較這這兩種設備備,要使用用日常的數數據,現有有設備的歷歷史日合格格率的標準準差為3%,要求新新的焊接機機有相同的的日合格率率散布。我們可接受受的α風險是0.01((指兩臺設備備有差異而而實際上并并沒有差異異的機會))我們可接受受的β風險是0.20((說兩臺設備備合格率相相同而實際際上并不同同的機會)[例題1]:1-樣本t-檢驗時的樣本容量的的計算零假假設設(Ho):新設設備備的的合合格格率率并不不比比現有有的的設設備備好備擇擇假假設設(Ha):新設設備備的的日日合合格格率率比現有有的的設設備備高焊接接機機:假假設設在這兩兩個個假假設設之之間間需需要要選選擇擇多多大大的的樣樣本本容容量量呢呢??從所所給給的的信信息息,,我我們們得得到到顯著著水水平平,a=0.01檢驗驗功功效效=1-b=0.80.平均均值值間間的的差差異異,d=85-80=5.標準準差差,s=3備擇擇假假設設(Ha)為新新設設備備的的日日合合格格率率比比現現有有的的設設備備高高焊接接機機:需需要要的的樣樣本本容容量量選擇擇Stat>PowerandSampleSize>1-Samplet.5.輸入入alpha,a2.輸入入檢檢驗驗功功效效,1-b1.輸入入delta,d4.選擇擇備備擇擇假假設設3.輸入sigma,s填選項1-3;然后點“Options”再填選項項4和5;;最后,在所所有打開開的窗口口中點OK焊接機:利用用MinitabMinitab告訴我們們,至少少要抽取取7個樣樣本,才才能保證證在我們們的檢驗驗功效為為0.80的情況下下,把新新焊接機機是否比比現有的的設備高高5個百百分點準準確檢測測出來(注:N=7時,實際際的檢驗驗功效為為0.8512)焊接機:Minitab輸出PowerandSampleSize1-SampletTestTestingmean=null(versus>null)Calculatingpowerformean=null+differenceAlpha=0.01Assumedstandarddeviation=3SampleTargetDifferenceSizePowerActualPower570.80.851212某工程師師想通過過實施一一個全階階乘DOE(3因子,8運行),來研研究恒溫溫箱對溫溫度、流流體密度度和液罐罐變化的的動作靈靈敏度;;0.001英寸的動動作就影影響功能能表現。。設計隊隊想探測測這樣或或更高幅幅度的影影響;必須考慮慮恒溫箱箱動作中中的工程程散布,,SPC數據顯示示標準偏偏差約為為0.001英寸;可以接受受的α風險(說說一個因因子的兩兩個水平平不同,,而實際際上相同同的風險險)是0.03;由于時間間的限制制,只能能作兩次次再現((共16次運行行),有關該DOE計劃的報報告必須須上報給給工程主主管。[例題2]-檢驗功效效計算::恒溫箱箱DOE零假設(Ho):實驗因子子對恒溫溫箱動作作沒有影響響備擇假設設(Ha):實驗因子子對恒溫溫箱動作作有影響恒溫箱DOE:假設觀察到0.001英寸尺度度影響((當此影影響存在在時)的的概率是是多少??(即此此計劃完完的DOE的檢驗功功效是多多少?))從所給的的信息,,我們知知道顯著水平平,a=0.03再現數=2.影響差異異,d=0.001英寸標準偏差差,s=0.001英寸備擇假設設(Ha)是,因子子對恒溫溫箱的動動作有影影響恒溫箱DOE:檢驗功效效選擇Stat>PowerandSampleSize>2LevelFactorialDesign6.輸入alpha,a2.輸入循環數填寫選項項1-5。。然后點“Options”并填選項項6。最后,在在所有打打開的窗窗口中點點OK1.輸入因子子數4.輸入影響響尺度,d5.輸入sigma,s3.輸入再現現數恒溫箱DOE:利用MinitabMinitab告訴我們們,兩次次再現時時的檢驗驗功效只只有0.3234,,這意味著著我們很很可能不不能看到到0.001英寸尺度度的影響響,顯然需要要更多的的再現數數.恒溫箱DOE:Minitab輸出PowerandSampleSize2-LevelFactorialDesignAlpha=0.03Assumedstandarddeviation=0.001Factors:3BaseDesign:3,8Blocks:noneCenterTotalPointsEffectRepsRunsPower00.0012160.323375某公司正正在考慮慮決定是是否變更更供應商商;供應商X是當前的的供應商商,其不不良率約約為10%;;而供應商Y是一個新新供應商商,其許許諾提供供部品的的不良率率將小于于10%;;顧客認為為如果供供應商Y比供應商商X的不良率率小1個個百分點點,則更更換供應應商就有有經濟利利益;用來決定定是否值值得采用用供應商商Y的樣本容容量是多多少?為了比較較,分別別計算獲獲得檢驗驗功效為為0.6、、0.7、0.8和0.9所需要的的樣本容容量;假設a=0.05[例題3]-樣本本容量計計算:拒絕部品品比例零假設設(Ho):供應商商之間間部品品的不不良率率沒有有差異異備擇假假設(Ha):供應商商X的部品品不良良率要要大于于供應應商Y的拒絕部部件的的比例例:假假設在檢驗驗功效效分別別為0.6、0.7、0.8和0.9時時,能能計算算并比比較兩兩個觀觀察的不良良率所所需樣樣本容容量是是多少少?從所給給的信信息,,我們們知道道顯著水水平,a=0.05如果供供應商商Y的部品品不良良率要要比供供應商商X低一個個百分分點,,顧客將將選擇擇供應應商Y比例的的差異異,d=0.01備擇假假設(Ha)是供應應商X的不良良率大大于供供應商商Y的不良良率拒絕部部品比比例:樣樣本容容量選擇Stat>PowerandSampleSize>2Proportions5.輸入alpha,a4.指定供應商X大于供應商商Y先填選項1-3;然后點“Options””并填選項4和5;最后后,在所有有打開的窗窗口中點OK2.輸入檢驗功功效3.輸入供應商商Y的比例拒絕部品比比例:利利用Minitab1.輸入供應商商X的不良率PowerandSampleSizeTestforTwoProportionsTestingproportion1=proportion2(versus>)Calculatingpowerforproportion2=0.09Alpha=0.05SampleTargetProportion1SizePower
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《傳統養生之道課件》課件
- 江蘇省宿遷市2024-2025學年高一下學期期中調研語文試卷(含答案)
- 2025年四川省廣元市劍閣縣中考二模道德與法治試卷(含答案)
- 玻璃門承建合同協議
- 環保物品采購合同協議
- 用戶公寓出租合同協議
- 電子器件購銷合同協議
- 電器大賣場合同協議
- 監測安全合同協議書模板
- 珠寶玉器購銷合同協議
- 政務服務中心物業服務投標方案
- 小兒循環系統解剖生理特點
- 青島海爾納稅籌劃課程設計
- 小學動詞三單練習
- 中醫特色貼敷療法和處方
- 臨時文件文件資料管理制度
- 【葛根素的藥理作用及臨床應用調研報告3000字】
- 教師情緒和壓力疏導
- 首件檢查記錄表
- 國開2023年秋《分析化學(本)》形考任務1-3參考答案
- 控制計劃(中英文標準模板)
評論
0/150
提交評論