




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基礎統計學(初級)講義Paladinma
2011-6-22輕松學統計下列哪一種敘述方式最完整呢?背板螺孔扭力強度很好;背板螺孔扭力強度平均為10kg/cm^2;大多說產品的螺孔扭力強度在(10±0.8)kg/cm^2以內;99.73%的產品的螺孔扭力強度在(10±0.8)kg/cm^2以內統計學的定義研究如何搜集資料、整理資料和進行數量分析、推斷的一門方法論科學。研究數量方面的研究客觀現象總體的數量特征研究不確定現象一門方法論的科學單個單個單個單個單個單個單個單個樣本不確定性:受到偶然的,隨機因素的作用統計學的分類理論統計學應用統計學基本統計量統計分布描述統計推斷統計參數估計非參數估計假設檢驗SPC相關/回歸分析方差分析(變異數)實驗設計DOE多變量分析統計方法基礎篇應用篇統計能幫你、我做什么?問題之現狀分析真因驗證對策擬定效果確認解決問題思路1、敘述統計量2、估計1、假設檢驗2、ANOVA3、DOE1、假設檢驗2、回歸分析3、DOE1、假設檢驗2、估計Syllabus描述統計總體與樣本描述統計量統計分布描述及概率分布抽樣分布推斷統計估計假設檢驗計量型資料檢驗計數型資料檢驗統計測定的層次掌握統計測定的不同層次,對于正確地分析數據和選擇檢驗方法(參數檢驗、非參數檢驗)是十分重要的!統計要素一、總體(母體)客觀存在的,具有某種共同性質的許多個體構成的整體,由數據特性可分為:計量型總體:如長度、重量、時間等計數型總體:如男女、ok與ng等二、樣本:從總體中隨機抽取若干單位構成的集合體一般n在30以下者稱為小樣本,n在30以上時稱為大樣本三、推斷以樣本所包含信息為基礎對總體的某些特征作出判斷,預測和估計。四、推斷的可靠性總體與樣本的關系明確調查的總體,從總體中抽取樣本并對樣本的信息加以分析,根據樣本信息對總體作出判斷,對推斷的可靠性加以測定。樣本總體抽樣/實驗推論隨機試驗、隨機事件、隨機變量在同一組條件下,對某事物或現象所進行的觀察或實驗叫隨機試驗(Experiment)把觀察或實驗的結果叫隨機事件。如果隨機試驗的每一種結果可以用一個數字作為其代表,則稱為隨機變量一、連續型continuous(計量型):可以用單位來度量二、離散型discrete(計數型):表現為屬性和類別基本統計量眾數中位數平均數四分位數極差-全距方差和標準差離散系數四分位差集中趨勢一組資料向其中心靠攏的傾向與程度集中趨勢及時尋找一般水平的代表值選用哪一個測量值來反映資料的集中趨勢,要根據資料的類型來決定。集中趨勢
眾數:出現次數最多的資料點,可能沒有或有多個中位數QM:排序后,位于中間位置的值平均值:一組資料的均衡點所在各資料點與平均值間的距離和為0
各資料點與平均值間的距離平方和為最小最常用的量測值
四分位數:用三個數值Q1、Q2、Q3把變量數列中全部單位分為四個部分,這三個數值稱為四分位數四分位數---箱線圖111212122231323414245152561626717278182891929102030四分位數---箱線圖(事例)眾數、中位數與平均值的關系眾數<中位數<平均數右偏分布平均數<中位數<眾數左偏分布分散趨勢反映各資料點遠離其中心的程度從另一個方式來說明集中趨勢的代表程度兩組數據的平均值相同,但上面的數據散布程度比較大分散趨勢全距R:數據資料中最大與最小之差Max-Min方差與標準差:離散系數:指消除平均數影響后的標志變異指標,其形式為相對數。標準差系數:標準差與其對應的平均值之比
---用于對不同資料組別的離散程度比較
---消除資料的不同水準和不同單位的影響分散程度---方差與標準差方差標準差總體樣本注意:樣本的方差分母用n-1去除分散程度---自由度指一個樣本中各隨機變量的數值可以自由變動的項數。如樣本中有n個隨機變量,每一項數值都可以自由變動,則其自由度為n;如n個隨機變量的平均數已確認,則只有n-1個隨機變量的數值可以自由變動,而剩余的另一個隨機變量必然由該平均數與n-1個隨機變量的數值所決定,不能自由變動,則這時n個隨機變量的自由度為 n-1。例如:樣本數為3,X1=2,X2=4,X3=9,則X=5。當X=5確定時,在X1,X2,X3中只能由兩個資料點可以自由取值,例如X1=6,X2=7,那X3必然為21、眾數:40、46、592、中位數為Qm:第個數,即為3、平均數為:Casestudy---各統計量的計算3434353536404040424245464646474849515255555859595960636465637865686870717373787981828485899496102102108Casestudy---各統計量的計算34343535364040404242454646464748495152555558595959606364656378656868707173737879818284858994961021021084、全距:5、方差:6、標準差:7、標準差系數:利用excel的分析工具箱Note:excel之“工具”--〉”數據分析”--〉描述統計Syllabus描述統計總體與樣本描述統計量統計分布描述及概率分布抽樣分布推斷統計估計假設檢驗計量型資料檢驗計數型資料檢驗統計分布描述分布---分布的呈現分布圖---直方圖隨機變量的分布隨機變量的取值是隨機的,但內在還是有規律性的,這個規律性可以用分布來描述。1、可能取什么值,或在哪個區間上取值。2、取這些值的概率各是多少,或在任一區間上取值的概率是多少?例如:擲一個骰子常用之分布(一)常用離散型分布---計數型數據1、二項分布2、泊松分布3、超幾何分布(二)正態分布---計量型數據(三)其他連續分布1、均勻分布2、對數正態分布3、指數分布二項分布由n次隨機試驗組成的隨機現象,它滿足如下條件1、重復進行n次隨機試驗;2、n次隨機試驗間相互獨立;3、每次試驗僅有兩個可能結果;4、每次試驗成功的概率均為p,失敗的概率均為1-p二項分布例:從不合格品率為0.1的成品中隨機抽取6個,計X為6個成品中的不合格數,則X服從二項分布b(6,0.1),簡記X~b(6,0.1)P=0.3n=10,30,50,80n=30p=0.1,0.3,0.5,0.8二項分布特性1、當n愈大時,對稱性愈明顯2、當p愈接近0.5時,愈接近左右對稱實際應用np>=5&n(1-p)>=5時二項分布可用正態分布來描述泊松分布用來描述如下的隨機變量的概率分布1、在一定時間內,電話總站接錯電話的次數2、在一定時間內,某操作系統發生的故障3、一個鑄件上的缺陷數4、一平方米玻璃上氣泡的個數5、一件產品因擦傷留下的痕跡個數泊松分布總與計點過程相關聯,并且計點是在一定時間內、或一定區域內、或一特定單位內的前提下進行的,若λ表示某特定單位內的平均點數(λ>0),令X表示出現的點數,則X取x值的概率例:某公司一個月發生重大事故數X服從泊松分布,根據以往的記錄,該公司一個月平均發生1.2起重大事故,這表明:X服從λ=1.2的泊松分布。泊松分布超幾何分布從一個有限總體中進行不放回抽樣常遇到超幾何分布。設有N個產品組成的總體,其中含有M個不合格品。若從中隨機不放回地抽取n個產品,則其中不合品的個數X是一個離散隨機變量,假如n<=M,則X可能取0,1,2…n若n>M,則X可能取0,1,2…M其中r=min(n,M)例:20個樣品中,其中5個有缺陷,若從中隨機抽取8個,抽中缺陷的數量X的分布:在實際應用中,當n/N<=0.1,可以用二項概率去近似超幾何概率超幾何分布正態分布正態分布函數左右兩尾與橫軸漸漸接近但不相交正態分布有兩個變相點,分別在μ±σ對應的地方正態分布為左右對稱的概率分布正態分布隨機變量的線性函數仍為正態分布正態分布中心到各標準差(σ)之間的概率分布如下0.02150.13590.34130.68260.95440.9973標準正態分布假如X服從正態分布則Z=(X-μ)/σ會服從μ=0,σ=1的正態分布此時的正態分布稱為標準正態分布Z=(X-μ)/σ的轉換過程為標準化設X~N(μ,σ2
)則Z=~N(0,1)若X~N(10,4),通過標準化變換Z=~N(0,1)μσx0,1z正態分布在6σ界限內居中的正態分布圖正態分布在偏移1.5σ情況下的正態分布圖μ標準正態分布---應用產品質量特性X的不合格品率:例:某廠生產電阻的規格限為80±4,從現場得知電阻值X服從正態分布,均值μ=80.8,σ=1.3,則低于規格下限和規格上限的概率為:標準正態分布表Syllabus描述統計總體與樣本描述統計量統計分布描述及概率分布抽樣分布推斷統計估計假設檢驗計量型資料檢驗計數型資料檢驗抽樣分布所有的樣本統計量(平均值、比例、方差等)所形成的分布稱為抽樣分布結果來自樣本數目相同的所有可能樣本樣本平均值的抽樣分布樣本比例的抽樣分布樣本方差的抽樣分布樣本平均值的抽樣分布例:假設一總體含有四個元素,即總體之總個數N=4,四個元素分別為則總體的平均值、方差及分布如下:樣本平均值的抽樣分布若從總體中抽取n=2的隨機樣本,共有4*4=16個可能樣本,計算出各樣本之平均,并給出其平均值的分布。樣本平均值的抽樣分布樣本平均值的抽樣分布M為所有可能樣本數目比較與總結:樣本平均的平均(數學期望)等于總體平均樣本平均的方差等于總體方差的1/n中央極限定理設從平均值為u,方差為σ2的一個任意分布總體(離散分布或連續分布、正態分布或非正態分布)中抽取個數為n的樣本,當n夠大時,樣本平均值的抽樣分布近似于平均值為u,方差數為σ2/n的正態分布一個任意分布的總體當樣本數足夠大時(n>30)樣本平均值得抽樣分布趨近于正態分布中央極限定理減少測量誤差的方法:對同一個零件的質量特性作兩次或更多次重復測量,并用其均值去估計過程輸出的質量特性,這可以減少標準差,從而測量系統的精度就自動增加了。這種簡易的方法可以使多次測量的平均值比單次測量值更具穩定性!總體Ⅰ:均勻分布總體Ⅱ:雙峰分布總體Ⅲ:指數分布中央極限定理必須符合下列二條件:1、σ需已知2、樣本足夠大(n>30)思考:但大部分的情況σ是未知的,還可以用中央極限定理嗎?中央極限定理的限制T分布當σ未知,且樣本不夠大時,可以用樣本標準差s來替代σ,仍可得到跟正態分布接近的性質此分布的自由度為n-1之t分布T分布可用于總體方差未知時正態總體均值的估計與檢驗,以及線性回歸模型中回歸系數的顯著性檢驗等n=∞n=20n=1T分布的性質
T分布是均值為0的對稱的鐘形曲線,取值范圍在-∞與+∞之間;
T分布的方差大于1,與標準正態相比,t分布的中心部分較低,兩個尾部較高;隨著自由度n的不斷增大,t分布越來越趨近于標準正態分布,并以其為極限;
T(∞)≈N(0,1)不同自由度的t分布大樣本
(n≧30)中央極限定理正態總體σ已知正態分布性質小樣本
(n﹤30)總體σ未知t分布性質大樣本
(n≧30)中央極限定理非正態小樣本
(n﹤30)抽樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五車輛抵押貸款合同范例
- 學前教育專業舞蹈課程
- 2024年四年級英語下冊 Unit 3 My day第4課時教學設計 譯林牛津版
- 網箱填石拆除施工方案
- 建筑工地工人標準勞動合同7篇
- 油布遮雨施工方案
- 寧夏公務員2024年真題
- 江蘇公務員考試真題2024
- 邢臺硫酸池防腐施工方案
- 2025-2030中國屋頂襯墊行業市場現狀供需分析及投資評估規劃分析研究報告
- 數學-河南省湘豫名校聯考2024-2025學年高三下學期春季學期第二次模擬考試(湘豫二模)試題和答案
- 中央2025年中國殘聯直屬單位招聘26人筆試歷年參考題庫附帶答案詳解
- 2025年廣西壯族自治區南寧市青秀區中考一模英語試題(含答案)
- GB/T 10810.2-2025眼鏡鏡片第2部分:漸變焦
- (2025)會計基礎考試題庫及答案(帶答案解析)
- 2025年暖通空調考試試題及答案
- 2025年鐵塔安全考試試題及答案
- AI技術在舞蹈實訓空間設計中的創新應用
- 《中國傳統民居建筑特點》課件
- TEE在心臟手術中的應用
- 2025年武漢農業集團限公司(校招)招聘【12人】高頻重點模擬試卷提升(共500題附帶答案詳解)
評論
0/150
提交評論