數(shù)據(jù)挖掘?qū)嶒瀳蟾?對電信客戶的分析_第1頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?對電信客戶的分析_第2頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?對電信客戶的分析_第3頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?對電信客戶的分析_第4頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?對電信客戶的分析_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘?qū)嶒瀳蟾?姓名:段雯娟 學(xué)號:1106122310專業(yè):會計學(xué)一、實驗?zāi)康?、學(xué)習(xí)和了解數(shù)據(jù)挖掘的基礎(chǔ)知識,學(xué)會使用SPSS Clementine11.1 軟件進行數(shù)據(jù)挖掘分析。2、使用軟件利用多項Logistic回歸對電信業(yè)客戶數(shù)據(jù)進行分析,找出電信服務(wù)使用模式和客戶個人特征之間的關(guān)系,為單個預(yù)期客戶定制服務(wù)使用模式。3、掌握數(shù)據(jù)挖掘過程的一般流程。二、實驗環(huán)境系統(tǒng)環(huán)境:Windows 7軟件環(huán)境:SPSS Clementine11.1軟件簡介:作為一個數(shù)據(jù)挖掘平臺, Clementine結(jié)合商業(yè)技術(shù)可以快速建立預(yù)測性模型,進而應(yīng)用到商業(yè)活動中,幫助人們改進決策過程。強大的數(shù)據(jù)挖掘功

2、能和顯著的投資回報率使得Clementine在業(yè)界久負(fù)盛譽。同那些僅僅著重于模型的外在表現(xiàn)而忽略了數(shù)據(jù)挖掘在整個業(yè)務(wù)流程中的應(yīng)用價值的其它數(shù)據(jù)挖掘工具相比, Clementine其功能強大的數(shù)據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投資回報周期的同時極大提高了投資回報率。三、實驗數(shù)據(jù)本實驗所采用的數(shù)據(jù)是電信客戶資料記錄,名為telco.sav的數(shù)據(jù)。該數(shù)據(jù)包含11個字段,1000條記錄。這些字段是:region(地區(qū))、age(年齡)、marital(婚姻狀況)、address(地址)、income(收入)、ed(教育程度)、employ(行業(yè))、retire(退休)、gender(性

3、別)、reside(居住地)和custcat(客戶類別),其中客戶類別中1代表基本服務(wù),2代表電子服務(wù),3代表附加服務(wù),4代表全套服務(wù)。四、實驗步驟與分析過程1、從數(shù)據(jù)源中選擇“SPSS文件”拖入工作框,如圖1,然后編輯附加數(shù)據(jù)。如圖2。圖1圖22、添加“類型”節(jié)點(如圖3),并對節(jié)點進行編輯,如圖4,將值為0和1的變量設(shè)為標(biāo)志字段,但是性別設(shè)為集合字段,將客戶類別字段的方向設(shè)置為輸出,其他字段的方向都設(shè)為輸入。圖3圖43、添加過濾節(jié)點(如圖5),并對其進行編輯,選取所需要的字段:region、age、marital、address、income、ed、employ、retire、gender

4、、reside、custcat,將其他字段過濾掉(如圖6)。圖5圖64、添加Logistic 節(jié)點進行建模(如圖7),并對節(jié)點進行編輯,如圖8、9、10,圖7圖8圖9圖105、執(zhí)行當(dāng)前流(如圖11),該模型custcat就會添加到右邊的模型選項板中(如圖12)。圖11圖126、瀏覽生成的模型,結(jié)果如圖13、14、15、16、17、18所示。圖13說明1基本服務(wù)為參照類,結(jié)果包括3個回歸方程:logP2P1=-0.04901+0.1477reside+0.02635employ-0.6764ed=4-0.9709ed=3-1.508ed=2-2.17ed=1+0.03685address (1)

5、logP3P1=-1.551+0.08447reside+0.05133employ+0.4647ed=4+0.6729ed=3+0.7185ed=2+0.5556ed=1+0.02157address (2)logP4P1=0.1806+0.2576reside+0.0424employ-0.5843ed=4-1.453ed=3-1.959ed=2-3.762ed=1+0.02184address (3)其中P1、P2、P3、P4分別表示選擇基本服務(wù)、電子服務(wù)、附加服務(wù)、全套服務(wù)的概率,logP2P1表示選擇電子服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)。從方程中可以看出,選擇電子服務(wù)概率與選

6、擇基本服務(wù)概率之比的自然對數(shù)、選擇附加服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)、選擇全套服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)都與address(地址)、employ(行業(yè))、reside(居住地)成正比,選擇電子服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)、選擇全套服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)與教育各個等級都成反向關(guān)系,且教育水平越高,對它們的影響越小,選擇附加服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)則與教育各個等級成正向關(guān)系。圖13圖14圖15圖14和15是各個字段的統(tǒng)計變量,總共有1000組數(shù)據(jù)。圖16 圖16中的顯著水平都小于0.05,說明四個變量與因變量的線性關(guān)系是顯著的,因此模型可用。圖17圖17中似然比檢驗的顯著水平小于0.05,說明模型的擬合優(yōu)度較好。圖18 圖18是模型的錯判矩陣,說明對實際使用基本服務(wù)的客戶的預(yù)測的正確率是45.9%,對實際使用電子服務(wù)的客戶的預(yù)測的正確率是4.6%,對實際使用附加服務(wù)的客戶的預(yù)測的正確率是47.3%,對實際使用全套服務(wù)的客戶的預(yù)測的正確率是56.8%,模型總的預(yù)測正確率為39.9%。說明模型在識別全套服務(wù)客戶時表現(xiàn)優(yōu)異,而在識別電子服務(wù)客戶時表現(xiàn)很差。如果想提高預(yù)測電子服務(wù)中客戶的準(zhǔn)確性,可能需要再找到一個預(yù)測變量來識別此類客戶。如果電信對識別電子服務(wù)中的客戶并不關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論