第八章輸入數據分析課件_第1頁
第八章輸入數據分析課件_第2頁
第八章輸入數據分析課件_第3頁
第八章輸入數據分析課件_第4頁
第八章輸入數據分析課件_第5頁
已閱讀5頁,還剩39頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一、輸入數據的收集第八章輸入數據分析二、分布的識別三、參數估計四、擬合度檢驗五、相關性分析一、輸入數據的收集第八章輸入數據分析二、分布的識別三、參數?模型的輸入數據哪里來?

輸入數據分析?模型的輸入數據哪里來?輸入數據分析生產仿真結果的準確性生產模型的準確建立仿真數據的準確性輸入數據是仿真模型的動力GIGO(garbageingarbageout)生產仿真結果的準確性生產模型的準確建立仿真數據的準確性輸入數系統名稱典型的輸入數據排隊系統

顧客到達的間隔時間顧客被服務時間的分布自動化物流系統

貨物到達間隔時間裝載時間卸載時間生產系統

作業到達的間隔時間作業類型的概率每種作業每道工序服務時間的分布可靠性系統

生產無故障作業時間

系統的仿真依靠這些原型系統的運行數據,缺乏這些數據的實驗和實驗值的提取,仿真也就毫無意義。系統名稱典型的輸入數據排隊系統顧客到達的間隔時間自動化物收集原始數據

基本統計分布的辨識參數估計

擬合度檢驗

可信否?否是是輸入數據分析的基礎,需要分析的經驗,對收集的方法、數據需要做預先的設計和估算。因此這是一個關鍵的、細致的工作。通過統計的數學手段(計數統計、頻率分析、直方圖制作等),得出統計分布的假設函數(如:正態分布、負指數分布、Erlang分布等)根據統計特征,計算確定系統的假設分布參數。運用統計分布的檢驗方法,對假設的分布函數進行可信度檢驗。通常采用的是

2檢驗。正確輸入數據

收集原始數據基本統計分布的辨識參數估計擬合度檢驗可一、輸入數據的收集

做好仿真計劃,詳細規劃仿真所需要收集的數據在收集數據過程中要注意分析數據數據的均勻組合收集的數據要滿足獨立性的要求數據自相關性的檢驗根據問題的特征,進行仿真的前期研究。分析影響系統的關鍵因素。從相關事物的觀察入手,盡量收集相關的數據。為此可以事先設計好調研表格,并注意不斷完善和修改調研方式,使收集的數據更符合仿真對象的數據需要。數據的收集與仿真的試運行是密切相關的,應當是邊收集數據、邊進行仿真的試運行。然而系統仿真是一項專業性很強的工作,要正確認識“仿真”的含義,抓住仿真研究的關鍵,避免求全、求精。確信所收集的數據足以確定仿真中的輸入分量,而對仿真無用或影響不顯著的數據就沒有必要去多加收集。針對仿真所收集的各個數據需要進行相關性檢驗。為了確定在兩個變量之間是否存在相關。要建立兩個變量的散布圖。通過統計方法確定相關的顯著性。盡量把均勻數據組合在一組里。校核在相繼的時間周期里以及在相繼日子內的一時間周期里的數據的均勻性。當校核均勻性時,初步的檢驗是看一下分布的均值是相同。考察一個似乎是獨立的觀察序列數據存在自相關的可能性。自相關可能存在于相繼的時間周期或相繼的顧客中。例如,第i個顧客的服務時間與(i+n)個顧客的服務時間相關。數據收集過程中的注意事項一、輸入數據的收集根據問題的特征,進行仿真的前二、分布的識別直方圖1直方圖的構造方法如下:取值區間劃分水平區坐間標標軸注的計區算間確內定的每發一生數垂直標坐注標頻軸數上繪上制的各發個生區頻間數繪制直方圖二、分布的識別直方圖1直方圖的構造方法如下:取水計區垂繪直方圖分組區間數量的選取1分組區間的組數依賴于觀察次數以及數據的分散或散布的程度。一般分組區間組數近似等于樣本量的平方根。即:

如果區間太寬(m太小),則直方圖太粗或呈短粗狀,這樣,它的形狀不能良好地顯示出來。如果區間太窄,則直方圖顯得凹凸不平不好平滑

合適的區間選擇(m值)是直方圖制作,分布函數分析的基礎。二、分布的識別直方圖分組區間數量的選取1分組區間的組數依賴于觀察次數以及數二、分布的識別二、分布的識別離散數據—汽車數量(p215)離散數據—汽車數量(p215)連續數據—電子元器件壽命(p217)連續數據—電子元器件壽命(p217)三、參數估計樣本均值和樣本方差(p221)1設某一個隨機過程X,其n個抽樣樣本為x1,x2,…,xn,該樣本的均值為該樣本的方差為如果離散數據已按頻數分組,則k是X中不相同數值的個數即分組數,fi是X中數值Xj的觀察頻數三、參數估計樣本均值和樣本方差(p221)1設某一個隨機過程參數估計量(p222)2分布參數建議使用的估計量泊松指數在(0,b)上的均勻分布正態,仿真中常用的一些分布參數建議值

三、參數估計參數估計量(p222)2分布參數建議使用的估計量泊松?理論分布和實際分布的差異程度?

擬合度檢驗?理論分布和實際分布的差異程度?擬合度檢驗四、擬合度檢驗k=6

Ei是在該分組區間的期望頻數。每一分組區間的期望頻數是Ei=npi,這里pi是理論值,是對應第i個分組區間的假設概率。

2擬合度檢驗式中,Oi是在第i個分組區間的觀察頻數。Oi=ni/n四、擬合度檢驗k=6Ei是在該分組區間的期可以證明:

02近似服從具有自由度f=k-s-1的

2分布。這里s表示由采樣統計量所估計的假設分布的參數個數。假設檢驗:H0:隨機變量X服從參數是由參數估計給出的分布假設。H1:

隨機變量X不確認若

2太大則拒絕H0,若擬合是好的,則期望值

2很小。擬合程度的判定四、擬合度檢驗首先劃分區間,定義k值計算各組的觀察頻數計算

0查閱

2表,得到如果,則拒絕H0擬合度檢驗步驟可以證明:02近似服從具有自由度f=k-s-1的2指定擬合度的檢驗我們可以根據擬合度檢驗的要求,設定一個擬合度的顯著性指數,根據設定的顯著性指數以及

2分布的自由度數f=k-s-1,可以查

2表得到

,f2。如果則檢驗未通過,H0不成立。如果則檢驗通過,H0成立。在應用這個檢驗時,如果期望的頻數太小,將對檢驗的有效性有所影響。一般情況下區間的個數k宜在30~40以下,并能使最小期望頻數Ei≥5。如果Ei值太小,可以把它和相鄰分組區間的期望頻數相合并,對應的Oi值也應該合并起來,同時每當合并一個單元,k值應該減去1。四、擬合度檢驗指定擬合度的檢驗我們可以根據擬合度檢驗的要求,設定一個擬合度四、擬合度檢驗注意:(1)被檢驗的分布離散

除非必須合并相鄰分組區間以滿足最小期望頻數的需要,否則隨機變量的每個值應該是一個分組區間(2)被檢驗的分布連續連續分布分組區間數量的推薦值樣本容量2050100>100分組區間個數k不使用

2檢驗5~1010~20四、擬合度檢驗注意:(1)被檢驗的分布離散五、輸入數據分析例題[1]p215在5分鐘周期內的到達數每個周期的到達數頻度每個周期的到達數頻度0126711075219853179341010358111收集數據1五、輸入數據分析例題[1]p215在5分鐘周期內的到達數每個分布辨識2五、輸入數據分析例題[1]分布辨識2五、輸入數據分析例題[1]分布辨識2五、輸入數據分析例題[1]分布辨識2五、輸入數據分析例題[1]參數估計3五、輸入數據分析例題[1]參數估計3五、輸入數據分析例題[1]擬合度檢驗4五、輸入數據分析例題[1]假設:泊松分布的概率質量函數:擬合度檢驗4五、輸入數據分析例題[1]假設:泊松分布的概率質五、輸入數據分析例題[1]對于α=3.64,不同x值的概率從概率質量函數得到:五、輸入數據分析例題[1]對于α=3.64,不同x值的概率從xi觀測頻度Oi期望頻度Ei0122.67.871109.621917.40.1531721.10.8041019.24.415814.02.57678.50.26754.411.62852.0930.81030.310.1合計10010027.682212.2177.6五、輸入數據分析例題[1]xi觀測頻度Oi期望頻度Ei0122.67.871109.6計算出:在顯著性水平α=0.05下,查表得出(p409):五、輸入數據分析例題[1]計算出:在顯著性水平α=0.05下,查表得出(p409):五電子元件壽命記錄79.9196.769144.6950.6247.0043.08159.8992.6335.3831.7646.20E-021.19217.9673.1481.0051.96134.769.10E-027.0781.1475.8455.0099.00323.960.2193.02718.3870.9410.593.2176.5050.1410.8781.92814.3822.10E-0243.5653.3710.31.0081.30E-0224.422.1572.00E-032.3360.1230.4337.5790.5434.562五、輸入數據分析例題[2]p216電子元件壽命記錄79.9196.769144.6950.62假設:令k=8,則每個區間p=0.125具有相等概率

2的檢驗五、輸入數據分析例題[2]假設:令k=8,則每個區間p=0.125具有相等概率2的檢五、輸入數據分析例題[2]五、輸入數據分析例題[2]分組區間觀測頻度Oi期望頻度Ei[0,1.590)196.2526.01[1.590,3.425)106.252.25[3.425,5.595)36.250.81[5.595,8.252)66.250.01[8.252,11.677)16.254.41[11.677,16.503)16.254.41[16.503,24.755)46.250.81[24.755,∞)66.250.01合計505039.6五、輸入數據分析例題[2]分組區間觀測頻度Oi期望頻度Ei[0,1.590)196.2計算出:在顯著性水平α=0.05下,查表得出:五、輸入數據分析例題[2]計算出:在顯著性水平α=0.05下,查表得出:五、輸入數據分六、相關性分析系統運行過程中,隨機變量有多個,如激勵存在多種因素的影響;系統參數的變化等。這些隨機變量之間可能是獨立的,也有可能是相互有牽連的,牽連程度的強弱有所不同。需要進行相關性分析。相關性分析的目的:更好地了解系統以及系統隨機變量的關聯性,更正確地把握問題的關鍵。六、相關性分析系統運行過程中,隨機變量有多個,如激勵存在多種六、相關性分析協方差和相關系數1協方差和相關系數是X1和X2之間線性相關程度的度量設X1和X2是兩個隨機變量,令分別是Xi的均值和方差。X1和X2的協方差的定義為六、相關性分析協方差和相關系數1協方差和相關系數是X1和X2六、相關性分析相關系數ρ越接近于-1或1,X1和X2之間的線性關系就越強六、相關性分析相關系數ρ越接近于-1或1,X1和X2之間的線六、相關性分析樣本協方差相關系數六、相關性分析樣本協方差相關系數提前期6.54.36.96.06.96.95.87.34.56.3需求量10383116971121041061099296六、相關性分析例題9.20:令X1表示工業機器人交貨的平均提前期,X2表示年需求量。下面的數據是過去10年的需求量和提前期:計算得到:提前期6.54.36.96.06.96.95.87.34.5六、相關性分析因此提前期和需求量有很強的依賴性六、相關性分析因此提前期和需求量有很強的依賴性單變量線性回歸2假設要估計在自變量x與一個因變量y之間的相關性。設在y與x之間真實相關是線性關系,這里觀察值y是隨機變量。而x是數學變量。那么在給定x的值之下,y的期望值假設是式中:

0為一未知常數,是x取零時y的值;

1為斜率,即x變化一個單位所引起的y的變化,也是一個待定的未知常數。六、相關性分析單變量線性回歸2假設要估計在自變量x與一個因變量y之間的相關假設y的每一個觀察值可用下式表示

y=

0+

1x+

式中

是均值為0,方差為

2的隨機誤差。假設存在n對觀察值(xi

,yi),i=1,2,……,n,通常采用最小二乘法來估計上式中的yi

。設

yi=

0+

1xi

+

ii=1,2,……,n,則

i

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論