




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘?qū)嶒瀳蟾?姓名:段雯娟 學(xué)號:1106122310專業(yè):會計學(xué)一、實驗?zāi)康?、學(xué)習(xí)和了解數(shù)據(jù)挖掘的基礎(chǔ)知識,學(xué)會使用SPSS Clementine11.1 軟件進行數(shù)據(jù)挖掘分析。2、使用軟件利用多項Logistic回歸對電信業(yè)客戶數(shù)據(jù)進行分析,找出電信服務(wù)使用模式和客戶個人特征之間的關(guān)系,為單個預(yù)期客戶定制服務(wù)使用模式。3、掌握數(shù)據(jù)挖掘過程的一般流程。二、實驗環(huán)境系統(tǒng)環(huán)境:Windows 7軟件環(huán)境:SPSS Clementine11.1軟件簡介:作為一個數(shù)據(jù)挖掘平臺, Clementine結(jié)合商業(yè)技術(shù)可以快速建立預(yù)測性模型,進而應(yīng)用到商業(yè)活動中,幫助人們改進決策過程。強大的數(shù)據(jù)挖掘功
2、能和顯著的投資回報率使得Clementine在業(yè)界久負(fù)盛譽。同那些僅僅著重于模型的外在表現(xiàn)而忽略了數(shù)據(jù)挖掘在整個業(yè)務(wù)流程中的應(yīng)用價值的其它數(shù)據(jù)挖掘工具相比, Clementine其功能強大的數(shù)據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投資回報周期的同時極大提高了投資回報率。三、實驗數(shù)據(jù)本實驗所采用的數(shù)據(jù)是電信客戶資料記錄,名為telco.sav的數(shù)據(jù)。該數(shù)據(jù)包含11個字段,1000條記錄。這些字段是:region(地區(qū))、age(年齡)、marital(婚姻狀況)、address(地址)、income(收入)、ed(教育程度)、employ(行業(yè))、retire(退休)、gender(性
3、別)、reside(居住地)和custcat(客戶類別),其中客戶類別中1代表基本服務(wù),2代表電子服務(wù),3代表附加服務(wù),4代表全套服務(wù)。四、實驗步驟與分析過程1、從數(shù)據(jù)源中選擇“SPSS文件”拖入工作框,如圖1,然后編輯附加數(shù)據(jù)。如圖2。圖1圖22、添加“類型”節(jié)點(如圖3),并對節(jié)點進行編輯,如圖4,將值為0和1的變量設(shè)為標(biāo)志字段,但是性別設(shè)為集合字段,將客戶類別字段的方向設(shè)置為輸出,其他字段的方向都設(shè)為輸入。圖3圖43、添加過濾節(jié)點(如圖5),并對其進行編輯,選取所需要的字段:region、age、marital、address、income、ed、employ、retire、gender
4、、reside、custcat,將其他字段過濾掉(如圖6)。圖5圖64、添加Logistic 節(jié)點進行建模(如圖7),并對節(jié)點進行編輯,如圖8、9、10,圖7圖8圖9圖105、執(zhí)行當(dāng)前流(如圖11),該模型custcat就會添加到右邊的模型選項板中(如圖12)。圖11圖126、瀏覽生成的模型,結(jié)果如圖13、14、15、16、17、18所示。圖13說明1基本服務(wù)為參照類,結(jié)果包括3個回歸方程:logP2P1=-0.04901+0.1477reside+0.02635employ-0.6764ed=4-0.9709ed=3-1.508ed=2-2.17ed=1+0.03685address (1)
5、logP3P1=-1.551+0.08447reside+0.05133employ+0.4647ed=4+0.6729ed=3+0.7185ed=2+0.5556ed=1+0.02157address (2)logP4P1=0.1806+0.2576reside+0.0424employ-0.5843ed=4-1.453ed=3-1.959ed=2-3.762ed=1+0.02184address (3)其中P1、P2、P3、P4分別表示選擇基本服務(wù)、電子服務(wù)、附加服務(wù)、全套服務(wù)的概率,logP2P1表示選擇電子服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)。從方程中可以看出,選擇電子服務(wù)概率與選
6、擇基本服務(wù)概率之比的自然對數(shù)、選擇附加服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)、選擇全套服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)都與address(地址)、employ(行業(yè))、reside(居住地)成正比,選擇電子服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)、選擇全套服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)與教育各個等級都成反向關(guān)系,且教育水平越高,對它們的影響越小,選擇附加服務(wù)概率與選擇基本服務(wù)概率之比的自然對數(shù)則與教育各個等級成正向關(guān)系。圖13圖14圖15圖14和15是各個字段的統(tǒng)計變量,總共有1000組數(shù)據(jù)。圖16 圖16中的顯著水平都小于0.05,說明四個變量與因變量的線性關(guān)系是顯著的,因此模型可用。圖17圖17中似然比檢驗的顯著水平小于0.05,說明模型的擬合優(yōu)度較好。圖18 圖18是模型的錯判矩陣,說明對實際使用基本服務(wù)的客戶的預(yù)測的正確率是45.9%,對實際使用電子服務(wù)的客戶的預(yù)測的正確率是4.6%,對實際使用附加服務(wù)的客戶的預(yù)測的正確率是47.3%,對實際使用全套服務(wù)的客戶的預(yù)測的正確率是56.8%,模型總的預(yù)測正確率為39.9%。說明模型在識別全套服務(wù)客戶時表現(xiàn)優(yōu)異,而在識別電子服務(wù)客戶時表現(xiàn)很差。如果想提高預(yù)測電子服務(wù)中客戶的準(zhǔn)確性,可能需要再找到一個預(yù)測變量來識別此類客戶。如果電信對識別電子服務(wù)中的客戶并不關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)程的三個分期及護理
- 呼吸困難癥狀護理
- 慢阻肺患者的護理查房
- 2025年單位工作方案
- 2025年春節(jié)創(chuàng)意活動策劃方案
- 利潤損失保險-突破傳統(tǒng)的財產(chǎn)險課件
- 12鋼結(jié)構(gòu)制作質(zhì)量控制QC發(fā)布
- 吉林省長春市九臺區(qū)2024-2025學(xué)年小升初總復(fù)習(xí)數(shù)學(xué)測試卷含解析
- 新入院患者的入院護理評估
- 教科版2025屆高考?xì)v史試題實戰(zhàn)演練仿真卷含解析
- GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達(dá)第3部分:音頻
- 《商務(wù)溝通與談判》全套教學(xué)課件
- 山西省晉中市榆次區(qū)2025年九年級中考一模數(shù)學(xué)試卷(原卷版+解析版)
- 校長在清明祭掃活動上講話緬懷先烈不是一種簡單的儀式而是一種深刻的情感表達(dá)和精神傳承
- 儲能行業(yè)項目風(fēng)險評估報告
- 廣東省2025年普通高等學(xué)校招生全國統(tǒng)一考試模擬測試(一)地理及答案
- 2025年中國郵政集團有限公司重慶分公司招聘筆試參考題庫含答案解析
- 《海上浮架用抗老化高密度聚乙烯(HDPE)踏板》
- 2025年山西運城農(nóng)業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫含答案
- 2025年廣東省佛山市南海區(qū)中考一模英語試題(原卷版+解析版)
- 論公安機關(guān)刑事立案制度:現(xiàn)狀、問題與優(yōu)化路徑
評論
0/150
提交評論