專題四:數據預測分析_第1頁
專題四:數據預測分析_第2頁
專題四:數據預測分析_第3頁
專題四:數據預測分析_第4頁
專題四:數據預測分析_第5頁
已閱讀5頁,還剩59頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據預測分析的兩個主要方面:數據預測分析的兩個主要方面:l時間序列預測時間序列預測l回歸分析預測回歸分析預測數據預測分析專題之一數據預測分析專題之一時間序列預測時間序列預測管理科學與工程學院管理科學與工程學院隋莉萍隋莉萍內容簡介內容簡介l時間序列的概念和組成l時間序列預測的步驟l衡量預測準確性的指標l移動平均模型移動平均模型和指數平滑模型指數平滑模型l趨勢預測模型趨勢預測模型l季節指數模型季節指數模型一、一、 時間序列預測概述時間序列預測概述 1.1.時間序列時間序列時間序列就是一個變量在一定時間段時間段內不同時間點時間點上觀測值的集合 。這些觀測值觀測值是按時間順序排列的,時間點之間的時間間

2、隔時間間隔是相等是相等的。可以是年、季度、月、周、日或其它時間段。常見的時間序列有:常見的時間序列有:按年、季度、月、周、日年、季度、月、周、日統計的商品銷量、銷售額或庫存量,按年統計的一個省市或國家的國民生產總值、人口出生率等。 產品名稱(全部)求和項:銷售金額年訂購日期匯總1996年7月27861.894968月25485.274999月26381.3999910月37515.7249111月45600.0449412月45239.629971997年1月61258.069932月38483.634943月38547.219974月53032.952435月53781.289936月363

3、62.802457月51020.857458月47287.669959月55629.24246 一、時間序列預測概述一、時間序列預測概述2.2.時間序列預測方法時間序列預測方法l定性分析方法定性分析方法l定量分析方法定量分析方法l外推法外推法:找出時間序列觀測值中的變化規律與趨勢觀測值中的變化規律與趨勢,然后通過對這些規律或趨勢的外推來確定未來的預測值。包括:移動平均和指數平滑法移動平均和指數平滑法趨勢預測法趨勢預測法季節指數法季節指數法l因果法:因果法:尋找時間序列因變量觀測值與自變量觀測值之間因變量觀測值與自變量觀測值之間的函數依賴關系的函數依賴關系(因果關系/回歸分析),然后利用這種函數

4、關系和自變量的預計值來確定因變量的預測值。一、一、 時間序列預測概述時間序列預測概述405060708090100110120130123456789 10 11 12月銷量無趨勢606570758085909510010513579 11 13 15 17 19 21 23月銷量線性趨勢9010011012013014015016017013579 11 13 15 17 19 21 23月銷量非線性趨勢02040608010012345678910 11 12月銷售額第 一 年第 二 年季節成分3.3.時間序列成分時間序列成分l趨勢成分趨勢成分:顯示一個時間序列在較長時期的變化趨勢 l季節

5、成分季節成分:反映時間序列在一年中有規律的變化 l循環成分循環成分:反映時間序列在超過一年的時間內有規律的變化 l不規則成分不規則成分:不能歸因于上述三種成分的時間序列的變化二、時間序列的預測步驟二、時間序列的預測步驟 l第一步,確定時間序列的類型第一步,確定時間序列的類型 即分析時間序列的組成成分(趨勢成分/季節成分/循環成分),確定預測類型。l第二步,選擇合適的方法建立預測模型第二步,選擇合適的方法建立預測模型 l如果時間序列沒有趨勢和季節成分,可選擇移動平均或指數平滑法l如果時間序列含有趨勢成分,可選擇趨勢預測法l如果時間序列含有季節成分,可選擇季節指數法l第三步,評價模型準確性,確定最

6、優模型參數第三步,評價模型準確性,確定最優模型參數 l第四步,按要求進行預測第四步,按要求進行預測2112)(11tnttnttFYnenMSE三三、移動平均模型和指數平滑模型移動平均模型和指數平滑模型 l適用于圍繞一個穩定水平上下波動的時間序列。l1.1.移動平均模型移動平均模型l利用平均使各個時間點上的觀測值中的隨機因素互相抵消掉,以獲得關于穩定水平的預測l將包括當前時刻在內的N個時間點上的觀測值的平均值作為對于下一時刻的預測值(N應選擇得使MSE極小化)NiittYNF1111l【例例1 1】某汽油批發商在過去12周內汽油的銷售數量如表所示: 試在Excel工作表中建立一個移動平均預測模

7、型來預測第13周的汽油銷量。實例:實例:移動平均模型移動平均模型周銷量(千加侖)周銷量(千加侖)117722221818319922423102051811176201222三三、移動平均模型和指數平滑模型移動平均模型和指數平滑模型汽油銷量觀測值及其移動平均預測值圖形1 19 9. .8 80 0101520253012345678910111213周銷量觀測值移動平均預測值移動平均跨度=5MSE=4.11三三、移動平均模型和指數平滑模型移動平均模型和指數平滑模型l2. 2. 指數平滑模型指數平滑模型l(改進移動平均預測模型),將計算平均值時對于不同時期觀測值的權數設置得不同:近期的權數較大,

8、遠期的權數較小2211)1 ()1 (ttttYYYFtttFYF)1 (1)(1ttttFYFF三三、移動平均模型和指數平滑模型移動平均模型和指數平滑模型l指數平滑的疊代算法時間序列觀測值:tF時間序列預測值tttFYF)1 (1:tY時間序列觀測值:tF時間序列預測值)(1ttttFYFF:tYl【例例2 2】利用例1的數據在Excel工作表中建立一個指數平滑預測模型來預測第13周的汽油銷量。實例:實例:指數平滑模型指數平滑模型汽油銷量觀測值及其指數平滑預測值20.0720.07101520253012345678910111213周銷量觀測值指數平滑預測值平滑常數=0.3MSE=6.95

9、實例:實例: 使用控件求解最優跨度和最優平滑指數使用控件求解最優跨度和最優平滑指數l【例例4/4/例例5 5】利用例1的數據在Excel工作表中建立一個利用函數函數和控件控件來控制移動跨度、平滑指數的移動平均模型和指數平滑預測模型來預測第13周的汽油銷量。l試探索共有幾種利用MSE求最優跨度和平滑系數的途徑?四、趨勢預測模型四、趨勢預測模型 l對于含有線性趨勢成分的時間序列,可以將預測變量在每一個時期的值和其對應時期之間的線性依賴關系表示為:l利用使均方誤差MSE極小的原則確定系數a與b,就可得到直線趨勢方程。以此求得每一個X Xi i所對應的預測值:nibXaYiii, 2 , 1 ,bXa

10、YiibXaY四、趨勢預測模型四、趨勢預測模型l求解求解a a和和b b的三種方法的三種方法:l利用Excel內建函數INTERCEPT()和SLOPE()l利用數組函數LINEST() l利用規劃求解工具l求解預測值的四種方法求解預測值的四種方法:l利用線性趨勢方程 直接計算l利用Excel內建函數TREND()l利用Excel內建函數FORECAST() l用特殊方法拖動觀測值所在范圍bXaY實例:實例:趨勢預測模型趨勢預測模型l【例例3 3】針對Northwind Traders公司月銷售額時間序列,建立趨勢預測模型,并預測該公司未來3個月的銷售額。 Northwind Traders公

11、司月銷售額觀測值及其直線趨勢預測值1 10 03 33 37 72 2. .6 60 09 99 99 91 15 5. .7 74 49 96 64 45 58 8. .8 88 80200004000060000800001000001200001400001996年7月1996年9月1996年11月1997年1月1997年3月1997年5月1997年7月1997年9月1997年11月1998年1月1998年3月1998年5月1998年7月觀測值預測值五、五、HoltHolt模型模型)(1 (11ttttTLXL11)1 ()(ttttTLLTtttTLY1實例:實例:HoltHolt預測

12、模型預測模型l【例例6 6】某商場兩年內各個月份的空調機銷售額數據如下表所示。假定商場空調機前年最后一個月的銷售額為42,前年銷售額的平均月增長幅度為2.93。試建立一個Holt模型對商場未來的銷售額進行預測。月份144月份757月份1379月份1996月份248月份867月份1482月份20100月份351月份972月份1580月份21100月份452月份1068月份1685月份22105月份558月份1172月份1794月份23110月份655月份1269月份1889月份24111商場各個月份空調銷售額商場各個月份空調銷售額六、季節指數模型六、季節指數模型l對于既含有線性趨勢成分又含有季節

13、成分的時間序列,須對其成分進行分解,這種分解建立在以下乘法模型的基礎上: 其中,Tt表示趨勢成分,St表示季節成分,It表示不規則成分。由于不規則成分的不可預測,因此預測值就可表示為趨勢成分和季節成分的乘積。ttttISTY六、季節指數模型六、季節指數模型l建立季節指數模型的一般步驟建立季節指數模型的一般步驟:l第一步,計算每一季(每季度,每月等等)的季節指數St 。l第二步,用時間序列的每一個觀測值除以適當的季節指數,消除季節影響。l第三步,為消除了季節影響的時間序列建立適當的趨勢模型并用這個模型進行預測。 l第四步,用預測值乘以季節指數,計算出最終的帶季節影響的預測值。 實例:實例:季節指

14、數模型季節指數模型l【例例7 7】某工廠過去4年的空調機銷量如下表所示,這些數據有明顯的季節性波動,試建立一個季節指數模型來預測第5年每個季度的空調機銷量 。l 四年內每季度的電視機銷量表四年內每季度的電視機銷量表 年季度銷量(千臺)年季度銷量(千臺)114.831624.125.63637.546.547.8215.8416.325.225.936.83847.448.4實例:實例:季節指數模型季節指數模型電視機銷量觀測值及其季度預測值7.097.096.496.498.638.639.199.1945678910第1年1季度第1年2季度第1年3季度第1年4季度第2年1季度第2年2季度第2年

15、3季度第2年4季度第3年1季度第3年2季度第3年3季度第3年4季度第4年1季度第4年2季度第4年3季度第4年4季度第5年1季度第5年2季度第5年3季度第5年4季度實例:實例:季節指數模型季節指數模型l【例例8 8】某工廠過去四個5年的納稅情況如右表所示,這些數據有明顯的季節性波動,試建立一個季節指數模型來預測下一個5年的納稅情況 。周期周期年年納稅額納稅額( (萬元萬元) )119864.819874.119885.61989619906.5219915.819925.219936.419946.819957.431996619975.619987.119997.520007.8420016.

16、320025.920037.52004820058.4本章小結本章小結l本章重點是時間序列的四種EXCEL工作表預測模型l移動平均模型l指數平滑模型l趨勢預測模型l季節指數模型l主要函數和EXCEL技術lOFFSET()、SUMXMY2()、INDEX()、MATCH()、INTERCEPT()、SLOPE()、LINEST()、TREND()、FORECAST() l“規劃求解”工具、“數據分析”工具、可調圖形的制作 bXaYNiittYNF1111tttFYF)1(1tttSTY數據預測分析專題之二數據預測分析專題之二回歸分析預測回歸分析預測管理科學與工程學院管理科學與工程學院隋莉萍隋莉萍

17、主要內容主要內容l回歸分析方法概述回歸分析方法概述l一元線性回歸分析一元線性回歸分析l多元線性回歸分析多元線性回歸分析l一元非線性回歸分析一元非線性回歸分析l多元非線性回歸分析多元非線性回歸分析一、回歸分析方法概述一、回歸分析方法概述l1. 回歸分析回歸分析 一種建立統計觀測值之間的數學關系的方法,其通過自變量的變化來解釋因變量的變化,從而由自變量的取值預測因變量的可能值。一、回歸分析方法概述一、回歸分析方法概述l2.自變量與因變量的相關關系自變量與因變量的相關關系 a. Y與Xk正線性相關b. Y與Xk負線性相關c. Y與Xk不相關XkYYYXkXk一、回歸分析方法概述一、回歸分析方法概述l

18、3. 一元線性回歸的擬合線方程一元線性回歸的擬合線方程bXaYXY一、回歸分析方法概述一、回歸分析方法概述l4. 確定擬合方程系數值的確定擬合方程系數值的最小二乘法最小二乘法 (原理:利用因變量估計值與觀測值之間均方誤差極小,來確定方程系原理:利用因變量估計值與觀測值之間均方誤差極小,來確定方程系數數)niiiniiiYbXanYYnMSE1212)(1)(1yxbMManiyiniyixiMYMYMXb121)()(極小一、回歸分析方法概述一、回歸分析方法概述l5. 回歸模型的檢驗回歸模型的檢驗l判定系數判定系數(R R2 2)用來判斷回歸方程的擬合優度用來判斷回歸方程的擬合優度通常可以認為

19、當R2大于0.9時,所得到的回歸直線擬合得較好,而當R2小于0.5時,所得到的回歸直線很難解釋因變量的變化(很難說明變量之間的依賴關系)。 lt t 統計量(統計量(T-testT-test)用來判斷單變量的解釋能力用來判斷單變量的解釋能力如果對于某個自變量,其t統計量的P值小于顯著水平(或稱置信度、置信水平),則可認為該自變量與因變量是相關的。 lF F 統計量(統計量(F-testF-test)用來判斷回歸方程的解釋能力用來判斷回歸方程的解釋能力如果F統計量的P值小于顯著水平(或稱置信度、置信水平),則可認為方程的回歸效果顯著。 一、回歸分析方法概述一、回歸分析方法概述l6. 回歸預測的步

20、驟回歸預測的步驟l第一步,獲取自變量和因變量的觀測值l第二步,繪制XY散點圖(單自變量?多自變量單自變量?多自變量?) l第三步,寫出帶未知參數的回歸方程 l第四步,用最小MSE原則確定回歸方程中參數值l第五步,判斷回歸方程的擬合優度R2l第六步,進行預測 實例:實例:一元線性回歸分析一元線性回歸分析【例例5-15-1】一個餐飲連鎖店,其主要客戶群是在校大學生。為了研究各店鋪銷售額與店鋪附近地區大學生人數之間的關系,隨機抽取了十個分店的樣本,得到的數據如下。試根據這些數據建立回歸模型。然后再進一步根據回歸方程預測一個區內大學生人數為1.6萬的店鋪的季度銷售額。店鋪編號區內大學生數季度銷售額(萬

21、人)(萬元)10.25.820.610.530.88.840.811.851.211.761.613.77215.78216.992.214.9102.620.2lXYXY散點圖散點圖二、一元線性回歸分析二、一元線性回歸分析匹薩店季度銷售額與學生人數關系圖051015202500.511.522.53學生數(萬人)銷售額(萬元)l求回歸系數求回歸系數a a和和b b的方法的方法:l規劃求解lINTERCEPT()和SLOPE()函數lLINEST()函數l回歸分析報告l散點圖添加趨勢線l求判定系數求判定系數R R2 2的方法的方法:lRSQ()函數l回歸分析報告l趨勢線二、一元線性回歸分析二、

22、一元線性回歸分析【例例5-25-2】試根據XXX公司在1996年7月4日至1998年5月8日期間各種商品的銷售額數據建立線性回歸模型,然后再進一步根據回歸方程預測該公司1998年5月和6月的月銷售額。實例:實例:一元線性回歸分析一元線性回歸分析Northwind Trader 月銷售額變化趨勢y = 3456.9x + 16951R2 = 0.69910200004000060000800001000001200001400000510152025月序號銷售額三、多元線性回歸分析三、多元線性回歸分析l多元線性回歸模型的一般形式多元線性回歸模型的一般形式l多元線性回歸預測步驟多元線性回歸預測步驟

23、l第一步,獲得候選自變量和因變量的觀測值。l第二步,從候選自變量中選擇合適的自變量。有幾種常用的方法:l最優子集法最優子集法l向前增選法、向后刪減法l逐步回歸法等l第三步,確定回歸系數,判斷回歸方程的擬合優度R2 。l第四步,根據回歸方程進行預測。 kkXbXbXbaY.2211實例:實例:多元線性回歸分析多元線性回歸分析【例例5-35-3】零售店將其連續15個月的庫存資金情況庫存資金情況、廣告廣告投入費用投入費用以及銷售額銷售額等方面的數據作了一個匯總,這些數據顯示在工作表單元格A1:D16。該店的管理人員試圖根據這些數據找到銷售額與其它二個變量之間的關系,以便進行銷售額預測并為未來的預算工

24、作提供參考。試根據這些數據建立回歸模型。如果未來某月庫存資金額為150萬元,廣告投入預算為45萬元,試根據建立的回歸模型預測該月的銷售額。 實例數據:實例數據:多元線性回歸分析多元線性回歸分析年年庫存資金庫存資金X1X1(萬元)(萬元)廣告投入廣告投入X2X2(萬元)(萬元)銷售額銷售額Y Y(萬元)(萬元)127524.51924218232.514023376382666420428.4157258523.5802626737.8202679630.1970833124.52305919621.41393105425.66581143240.230211237344.32684132352

25、6.617381415620.912461537226.12534三、三、回歸分析報告回歸分析報告:多元線性回歸分析多元線性回歸分析l以庫存資金和廣告為自變量的以庫存資金和廣告為自變量的回歸分析報告回歸分析報告1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 A B C D E F G H I J SUMMARY OUTPUT回歸統計Multiple R0.97843234R Square0.95732984Adjusted R Square0.95164049標準誤差97.1567227觀測值18方差分析dfSSMSFSignificanc

26、e F回歸分析231766861588343168.2669 5.3202E-11殘差15141591.49439.429總計173318277Coefficients標準誤差t StatP-valueLower 95%Upper 95%下限 95.0% 上限 95.0%Intercept86.953190475.117061.1575690.265141-73.155131 247.061512-73.155131 247.061512庫存資金7.108924741.0949926.4922191.02E-05 4.77500415 9.44284533 4.77500415 9.44284

27、533廣告13.68373142.8246954.8443210.000214 7.66303231 19.7044305 7.66303231 19.7044305 實例實例2:多元線性回歸分析多元線性回歸分析l【例例5-55-5】一零售店將其連續18個月的庫存占用資金情況、廣告投入的費用、員工薪酬以及銷售額等方面的數據作了一個匯總,這些數據顯示在工作表單元格A1:E20。試圖根據這些數據找到銷售額與其它三個變量之間的關系,試根據這些數據建立回歸模型,以便進行銷售額預測并為未來的預算工作提供參考。如果未來某月庫存資金額為150萬元,廣告投入預算為45萬元,員工薪酬為27萬元,試根據建立的回歸

28、模型預測該月的銷售額。實例數據:實例數據:多元線性回歸分析多元線性回歸分析年年庫存資金庫存資金X1X1(萬元)(萬元)廣告投入廣告投入X2X2(萬元)(萬元)員工薪酬總額員工薪酬總額X3X3(萬元)(萬元)銷售額銷售額Y Y(萬元)(萬元)175.230.621.11090.4277.631.321.41133380.733.922.91242.147629.621.41003.2579.532.521.51283.2681.827.921.71012.2798.324.821.51098.8867.723.621826.397433.922.41003.31015127.724.71554.

29、61190.845.523.2119912102.342.624.31483.113115.64023.11407.11412545.829.11551.315137.851.724.61601.216175.667.227.52311.717155.26526.52126.718174.365.426.82256.5實例散點圖實例散點圖1:多元線性回歸分析多元線性回歸分析銷售額與庫存資金的關系y = 11.398x + 171.62R2 = 0.89060500100015002000250050100150200庫存資金額(萬元)銷售額(萬元)實例散點圖實例散點圖2:多元線性回歸分析多元線

30、性回歸分析銷售額與廣告投入的關系y = 28.513x + 260.17R2 = 0.83740500100015002000250020304050607080廣告投入(萬元)銷售額(萬元)實例散點圖實例散點圖3:多元線性回歸分析多元線性回歸分析銷售額與員工薪酬的關系y = 150.28x - 2146.6R2 = 0.709605001000150020002500202224262830員工薪酬總額(萬元)銷售額(萬元)三、三、最優子集:最優子集:多元線性回歸分析多元線性回歸分析l用最優子集法作自變量篩選用最優子集法作自變量篩選比較結果表明,以庫存資金和廣告費用為自變量效果最好。2 3

31、4 5 6 7 8 9 G H I J R平方調整后R平方庫存資金X10.8910.884廣告X20.8370.827薪酬X30.7100.691庫存資金、廣告X1、X20.9570.952廣告、薪酬X2、X30.8700.852庫存資金、薪酬X1、X30.8980.885庫存資金、廣告、薪酬X1、X2、X30.9570.948自變量集三、三、回歸分析報告回歸分析報告:多元線性回歸分析多元線性回歸分析l以庫存資金和廣告為自變量的回歸分析報告以庫存資金和廣告為自變量的回歸分析報告1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 A B C D

32、E F G H I J SUMMARY OUTPUT回歸統計Multiple R0.97843234R Square0.95732984Adjusted R Square0.95164049標準誤差97.1567227觀測值18方差分析dfSSMSFSignificance F回歸分析231766861588343168.2669 5.3202E-11殘差15141591.49439.429總計173318277Coefficients標準誤差t StatP-valueLower 95%Upper 95%下限 95.0% 上限 95.0%Intercept86.953190475.117061

33、.1575690.265141-73.155131 247.061512-73.155131 247.061512庫存資金7.108924741.0949926.4922191.02E-05 4.77500415 9.44284533 4.77500415 9.44284533廣告13.68373142.8246954.8443210.000214 7.66303231 19.7044305 7.66303231 19.7044305 四、一元非線性回歸分析四、一元非線性回歸分析l用一條曲線來擬合因變量對于自變量的依賴關系。常見的一元非線性模型包括冪函數、指數函數、一元非線性模型包括冪函數、指

34、數函數、對數函數、雙曲線函數、二次多項式對數函數、雙曲線函數、二次多項式等等。l通過變量替換把問題轉化為一元或多元線性回歸問題后,用線性回歸分析的方法建立回歸模型,并進行預測。 四、一元非線性回歸分析四、一元非線性回歸分析l1冪函數冪函數設則XUlnYVlnXYa1b-1b-1(b1b 0)OObUaV lnbaXY XUlnYVln四、一元非線性回歸分析四、一元非線性回歸分析l2指數函數指數函數 設則bXaeY YVlnXebaV)ln(lnXYa(b 0)OO四、一元非線性回歸分析四、一元非線性回歸分析l3對數函數對數函數 設則XbaYlnXUlnXY(b 0)OOl3對數函數對數函數 設則l3對數函

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論