部分數據分析方法的應用基于ppt課件_第1頁
部分數據分析方法的應用基于ppt課件_第2頁
部分數據分析方法的應用基于ppt課件_第3頁
部分數據分析方法的應用基于ppt課件_第4頁
部分數據分析方法的應用基于ppt課件_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、主講人:鄧光耀1、概述 1.1數據分析的方法多種多樣,詳細選擇哪種方法分析數據,要由數據分析的目的來定。 1.2本講表達幾種在銷售等數據分析中能夠用到的方法,如RFM模型、回歸分析、相關分析等,這些方法都有一定的適用范圍,聽者不用拘泥于這些方法。 1.3對于數據分析,自然要有比較深沉的數學功底,但是大家的數學根底有限,因此本講既有必要節制性地引入數學知識,又不用對數學方法做夸耀性的濫用。2、RFM模型 2.1對于銷售人員,經常會遇到這樣的問題:假設他的客戶很多,但是由于他本人的精神與本錢有限,哪么他該當經過什么樣的方法區分哪些是該當重點處置的客戶? 2.2根據美國數據庫營銷研討所Arthur

2、Hughes的研討,客戶數據庫中有三個神奇的要素,這三個要素構成了數據分析最好的目的:最近一次消費(Recency),消費頻率(Frequency),消費金額(Monetary)。 2.3例1:我們分析2021.7.12021.12.31的買賣數據,如下表:客戶編號客戶編號最近一次消費日期最近一次消費日期買賣累計次數買賣累計次數買賣累計金額買賣累計金額/元元12021.9.3031062522021.11.2589236432021.12.281515236242021.8.202865452021.10.1653012862021.12.101212569672021.7.231302682

3、021.11.0674328692021.12.12510234102021.10.09425643 我們先處置最近買賣日期的數據,我們按照距2021.12.31日期的遠近來劃分等級,假設一周之內的數據設為5,如客戶3的最近買賣日期這分項可以設為5;大于一周且在一個月內的數據設為4,可得到客戶6、9的最近買賣日期這一分項可設為4;大于一個月且在兩個月內設為3,可得客戶2、8的最近買賣日期這一分項可設為3;大于2個月且在四個月內設為2,可得客戶1、5、10的最近買賣日期這一分項可設為2;大于四個月且在六個月內設為1,可得客戶4、7的最近買賣日期這一分項可設為1。這樣分類能否合理要由實際驗證。 依

4、次分類如下:2,3,5,1,2,4,1,3,4,2. 累計買賣次數我們可以簡單地按等分的方法分類,即1-3次設為1,4-6次設為2,7-9次設為3,10-12次設為4,13-15次設為5,可依次得到客戶的對應數值如下: 1,3,5,1,2,4,1,3,2,2 . 對于買賣金額,我們按照所謂的“帕雷托法那么(Paretos Law)來分類,即:公司80的收入來自20的顧客,不過我們不用拘泥于此法那么。 我們先在excel表格中按升序或者降序陳列買賣金額,再計算占一切客戶總金額的累計比例。我們計算可得到:0.300.550.740.820.880.940.960.980.991 我們做如下分類:客

5、戶3此分項為5,客戶2、6此分項為4,客戶5、8、10此分項為3,客戶1、9此分項為2,客戶4、7此分項為1. RFM模型的分類沒有一致的分類規范,只能按照實踐情況做大約的分類。 我們綜合以上步驟,可得到如下表格:客戶編號客戶編號RFM總分總分1212523341035551541113522376444127111383339942281022379, 3, 2, 2總分MFR9 我們對此表格做簡單的分析,假設銷售人員的精神與本錢有限,可以重點思索滿足以下條件的客戶: 由于相比于R,F,銷售人員能夠更看重M累計金額,故取 另外對總分也有一定的要求,這里我們取3M 以上分類規范的合理性需求銷售

6、人員的實際驗證。 另外我們可以對其他目的做類似的分類,對客戶群得到更好的管理。 例如送貨上門的話,該當思索運輸本錢,間隔近的客戶要優先思索。運輸本錢,可以參考河南禹州拉沙車的例子。 大家也可以把此模型中的方法運用到預備考試的時間分配上,3、回歸分析 3.1回歸分析regression analysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。運用非常廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。假設在回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,

7、這種回歸分析稱為一元線性回歸分析。假設回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關系,那么稱為多元線性回歸分析。 3.2例2:我們回到第一講的例子例5,價錢與銷售量的關系表: 我們處理以下問題:價錢與銷售量的函數表達式?并預測單價下降到30時的銷售量?銷售金額最大化時的價錢與銷售量分別是多少? 在上一講中我們得到如下散點圖:909510010511011512012501020304050單價與銷售量的關系102105108110112115120單價銷售量系列1線性 (系列1)我們建立兩變量的線性回歸模型: 其中 ,即服從期望為0,方差為 的正態分布。利用歷史數據,我們

8、可以得到 的值,由于歷史數據能夠不止兩組,由gramer 法那么知道1式的解能夠不存在。數學上以為使得 最小的a,b 的值是最正確估計值。bxay22)(iiiiibxay), 0 (2N 令 ,我們求它的偏導數,并令它們為零,即 這個方程組稱為正規方程組,令 分別為x,y兩個變量的樣本均值。那么有 ii20)(2iiibxaya0)(2iiiixbxaybxbyaiiiiiiiiiixnxyxnyxxxxxyyb222)()(yx , 聽者不用擔憂數學知識太多,不好了解,前面表達的只是方法,詳細操作可以用spss軟件得到回歸直線的方程。 我們如今在spss中輸入數據,利用上面的分析功能我們可

9、以得到以下數據: a=163.632,b=-1.388,故回歸直線的方程為: y=163.632-1.388x 當x=30時,我們由回歸直線方程得到y=121.992. 我們可得銷售金額的表達式為163.632-1.388x)x,故利用簡單的配方法或者求導運算,可得價錢為58.945元是銷售金額最大。 為了擴展回歸分析的運用范圍,我們在舉一個例子: 3.2例3:為了擴展回歸分析的運用范圍,我們再舉一個例子: 在這個例子里,我們推行到多元線性回歸模型。 詳細的數學論證比較復雜,不過運用的還是最小二乘法,可得到解向量為: 這里等式后面的均是對應的矩陣,詳細是什么意思,聽者可以參閱相關的資料,我們不

10、對此公式做證明,只需求用spss求出解向量就可以了。 下表為某廠商的消費數據,利用這些數據我們估計該廠商的消費函數及做相關的預測:YXXX/1/)(年份年份產值產值y/萬萬元元資本資本k/萬萬元元勞動力勞動力l/人人lnylnklnl20004572031756.125.315.1620014932071776.205.335.1820025142071846.245.335.2120035182141896.255.375.2420045242221956.265.405.2720055362421996.285.495.2920065842682066.375.595.3320076613

11、212116.495.775.3520217224422136.585.835.3620217774082146.666.015.3720218954852156.805.955.37LAKY LKAYlnlnlnln 我們采用經濟學常用的柯布道格拉斯消費函數的方式來估計,即 經對數變換處置后我們可以得到二元線性模型 這里 是后來加上去的隨機要素。 利用spss軟件運算得到LKYln346.0ln559.0413.1ln346.0559.0108.4LKY 我們整理得到 我們估計當K=500,L=220時的產值,代入我們得到的消費函數可以得到Y=857,(我們可以用excel函數計算,即=4.

12、108*power(500,0.559)*power(220,0.346)故估計產值在857萬元左右,當然實踐情況會遭到其他要素的影響,經過模型估計的產值只是大致的數值。 回歸分析還有許多其他用法,暫時不提。4、相關分析 4.1相關分析與回歸分析有很大的類似性,很多人不清楚他們的區別。我們列出相關分析的定義。 4.2相關分析correlation analysis,相關分析是研討景象之間能否存在某種依存關系,并對詳細有依存關系的景象討論其相關方向以及相關程度,是研討隨機變量之間的相關關系的一種統計方法。 4.3區別:相關分析與回歸分析在實踐運用中有親密關系。然而在回歸分析中,所關懷的是一個隨機

13、變量Y對另一個或一組隨機變量X的依賴關系的函數方式。而在相關分析中 ,所討論的變量的位置一樣,分析偏重于隨機變量之間的種種相關特征。例如,以X、Y分別記小學生的數學與語文成果,感興趣的是二者的關系如何,而不在于由X去預測Y。yxxyyxr),cov( 4.4相關系數的計算公式: 這個公式上一講出現過,如今詳細到離散情形的公式:22)()()(yyxxyyxxriiiixy4.5我們只表達線性相關分析:研討兩個變量間線性關系的程度。用相關系數r來描畫。正相關:假設x,y變化的方向一致,如身高與體重的關系,r0;普通地,|r|0.95 存在顯著性相關;|r|0.8 高度相關;0.5|r|0.8 中度相關;0.3|r|0.5 低度相關;|r|0.3 關系極弱,以為不相關負相關:假設x,y變化的方向相反,如吸煙與肺功能的關系,r0;無線性相關:r=0。假設變量Y與X間是函數關系,那么r=1或r=-1;假設變量Y與X間是統計關系,那么-1r1。 例4:下面為對應時間一樣時兩種股票價錢指數的數據表:指數指數12841284228712888298531292978297529712738指數22021202120212039213022792189223122541990 由圖可以看到這兩種股票價錢指數相關性很明顯,假設指數1在表格中的a1到a10,指數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論