家庭關聯關系識別模型_第1頁
家庭關聯關系識別模型_第2頁
家庭關聯關系識別模型_第3頁
家庭關聯關系識別模型_第4頁
家庭關聯關系識別模型_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

家庭關聯(guānlián)關系識別模型精品資料

-2現狀(xiànzhuàng)背景模型目標建模步驟模型解讀應用價值目錄(mùlù)精品資料

-3

行業競爭日趨激烈中國的通信行業走過了“引入競爭”和“市場嘗試”兩個過渡階段,已經開始逐步進入“充分競爭”的階段,行業競爭日趨激烈。

固定電話用戶數移動電話用戶數3G用戶數固定寬帶用戶數其中:集團客戶寬帶用戶數集團IDC用戶數注:上述數據來源于賽立信通信競爭情報月刊2010年4月

截止2009年底,三大運營商用戶分布情況1.89億約2500萬1.03億5609萬5.22億1.45億675萬551萬274萬5346萬約600萬3855萬約1700萬家(ADSL/LAN/各種光纖、專線)約2.2萬家(專線用戶)約900萬家(ADSL/LAN/各種光纖、專線)約3萬家約3200家約2萬家如何利用已有的固網和寬帶(kuāndài)客戶資源優勢實現移動客戶的增長?行業(hángyè)背景精品資料

-4業務(yèwù)背景無法提供有效的策反政策營銷手段模糊化營銷效率低下已有客戶資源的閑置傳統本網融合/異網策反方法不足移動、聯通、電信手機客戶群能提供適配用戶的資費政策外呼用戶信息(xìnxī)明確,指導性強名單準確率高,效率大大提高充分利用了固網、寬帶客戶資源基于家庭關聯關系的精確營銷優點電信個人用戶異網集團網用戶異網個人用戶電信家庭固話電信固話客戶群家庭關系精品資料

-5現狀背景(bèijǐng)模型目標建模步驟模型解讀應用價值目錄(mùlù)精品資料-6家庭關聯關系識別模型的主要目標:通過移動電話(yídònɡdiànhuà)與固定電話之間的通話頻率、通話時長、通話時段、通話周期和交際圈相似度等變量,進行分類預測建模,從而準確地識別出手機號碼與固定電話之間的家庭關聯關系;根據模型預測結果,對于本網手機進行融合套餐營銷,對于異網手機進行策反活動。通過營銷活動,實現兩個提升:提升市場份額、提升品牌力度建模目標(mùbiāo)符合家庭特征電信單固話C網手機符合家庭特征電信單固話G網手機融合套餐營銷異網客戶策反精品資料

-7現狀背景模型目標建模步驟(bùzhòu)模型解讀應用價值目錄(mùlù)精品資料

-8●假設條件:家庭用戶與非家庭用戶,在通話行為上存在顯著差異(chāyì),并且一個有固話的家庭至少存在一個家庭手機用戶.●基本思想:根據固定電話的個性化特征,得到與之關聯手機號碼的家庭關系評分,最高分即為家庭關系(最高分須不小于0.5)。●基本流程:樣本選取:找出本網屬于家庭關系的號碼對作為正樣本,并找出不屬于家庭關系的號碼對作為負樣本;寬表設計:分析正樣本中號碼對的通信行為特征,設計寬表;模型建立:使用挖掘工具clementine建立挖掘模型;模型驗證:根據技術指標以及抽樣驗證,對模型進行調優。分析(fēnxī)思路精品資料

-9樣本(yàngběn)選取正樣本需剔除以下幾類情況:資料不符:剔除客戶(kèhù)編碼、賬戶、身份證號碼三者中有不相同項的號碼對;互通異常:剔除兩個月中有一月無互通行為的號碼對;證件異常:剔除機主身份證號碼不合理、年齡大于70歲或小于18歲的號碼對;狀態異常:剔除非在用狀態、新增、公免的號碼對;匹配多元:剔除固話與手機為一對多關系的號碼對;最終選取符合上述規則的正樣本1653號碼對,負樣本9152號碼對,構成模型的樣本集。樣本選取寬表設計模型建立模型驗證正樣本負樣本已經辦理e6或e9套餐的【固話,手機】號碼對有通話但客戶賬戶證件均不同且非e家的【固話,手機】號碼對精品資料

-10寬表設計(shèjì)–基礎字段樣本(yàngběn)選取寬表設計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMES平均主叫次數WEEK_AM_CALLINGTIMES平均周中17-19:00主叫次數CALLED_TIMES平均被叫次數WEEK_AM_CALLEDTIMES平均周中17-19:00被叫次數CALL_TIMES總呼叫次數WEEK_AM_CALLTIMES平均周中17-19:00總呼叫次數CALLING_DURATION平均主叫時長WEEK_PM_CALLINGTIMES平均周中11-13:00主叫次數CALLED_DURATION平均被叫時長WEEK_PM_CALLEDTIMES平均周中11-13:00被叫次數CALL_DURATION總呼叫時長WEEK_PM_CALLTIMES平均周中11-13:00總呼叫次數SHORT_TIMES90秒以內通話次數WEEKED_CALLINGTIMES平均周末主叫次數LONG_TIMES90秒以上通話次數WEEKED_CALLEDTIMES平均周末被叫次數MIN_DURATION平均最短一次通話時長WEEKED_CALLTIMES周末呼叫次數MAX_DURATION平均最長一次通話時長AVG_DURATION平均通話時長FLAG2家庭關系標志設計字段原則:在該字段中,家庭用戶和非家庭用戶存在較顯著的統計差異。精品資料

-11寬表設計(shèjì)–標準化字段樣本(yàngběn)選取寬表設計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMES_R平均主叫次數比WEEK_AM_CALLINGTIMES_R平均周中17-19主叫次數比CALLED_TIMES_R平均被叫次數比WEEK_AM_CALLEDTIMES_R平均周中17-19被叫次數比CALL_TIMES_R總呼叫次數比WEEK_AM_CALLTIMES_R平均周中17-19總呼叫次數比CALLING_DURATION_R平均主叫時長比WEEK_PM_CALLINGTIMES_R平均周中11-13主叫次數比CALLED_DURATION_R平均被叫時長比WEEK_PM_CALLEDTIMES_R平均周中11-13被叫次數比CALL_DURATION_R總呼叫時長比WEEK_PM_CALLTIMES_R平均周中11-13總呼叫次數比SHORT_TIMES_R90秒以內通話次數比WEEKED_CALLINGTIMES_R平均周末主叫次數比LONG_TIMES_R90秒以上通話次數比WEEKED_CALLEDTIMES_R平均周末被叫次數比MIN_DURATION_R平均最短一次通話時長比WEEKED_CALLTIMES_R周末呼叫次數比MAX_DURATION_R平均最長一次通話時長比設計字段原則:不同的家庭用戶在通信行為上存在較大差異,單純用絕對值作為預測變量導致模型存在偏差,需要將其標準化,得出相對值。說明:比值是根據該固定電話用戶與某一手機號碼的變量值和該固定電話與全部手機號碼的最大值的比例。精品資料

-12寬表設計(shèjì)–衍生字段樣本(yàngběn)選取寬表設計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMESRANK當月主叫次數排名WEEK_AM_CALLINGTIMESRANK當月周中17-19主叫次數排名CALLED_TIMESRANK當月被叫次數排名WEEK_AM_CALLEDTIMESRANK當月周中17-19被叫次數排名CALL_TIMESRANK總呼叫次數排名WEEK_AM_CALLTIMESRANK當月周中17-19總呼叫次數排名CALLING_DURATIONRANK當月主叫時長排名WEEK_PM_CALLINGTIMESRANK當月周中11-13主叫次數排名CALLED_DURATIONRANK當月被叫時長排名WEEK_PM_CALLEDTIMESRANK當月周中11-13被叫次數排名CALL_DURATIONRANK總呼叫時長排名WEEK_PM_CALLTIMESRANK當月周中11-13總呼叫次數排名SHORT_TIMESRANK90秒以內通話次數排名WEEKED_CALLINGTIMESRANK當月周末主叫次數排名LONG_TIMESRANK90秒以上通話次數排名WEEKED_CALLEDTIMESRANK當月周末被叫次數排名MIN_DURATIONRANK當月最短一次通話時長排名WEEKED_CALLTIMESRANK周末呼叫次數排名MAX_DURATIONRANK當月最長一次通話時長排名JW_GUHUA_RATION重合度在固話交往圈占比JW_SHUOJI_RATION重合度在手機交往圈占比設計字段原則:利用排名的連貫性和區間性,能消除數值的影響,并且數據字段穩定的特性。精品資料-13模型(móxíng)建立1,數據探索,處理正負樣本比例,2,比較算法,選取最優算法3,最優算法建模,4,使用模型節點預測家庭關系,并進行模型評估,5,家庭關系打分,輸出家庭關系清單模型(móxíng)流展示:樣本選取寬表設計模型建立模型驗證使用clementine工具的決策樹算法建立模型,通過固話與手機之間的通話行為,提煉家庭成員的通化特征,形成可應用的業務規則。精品資料

-14模型(móxíng)驗證樣本(yàngběn)選取寬表設計模型建立模型驗證預測非家庭預測家庭合計實際非家庭86924609152實際家庭34013131653合計9032177310805判斷一個模型是否可接受,主要根據該模型對已有數據集的分類效果。其中幾個重要的檢測指標為:準確率、命中率、覆蓋率、提升度。3401313460實際家庭預測家庭8692非家庭預測為非家庭準確率:(8692+1313)/10805=92.60%命中率:1313/1773=74.06%覆蓋率:1313/1653=79.43%提升度:打分前10%成功率提升5.45倍精品資料

-15模型(móxíng)驗證樣本(yàngběn)選取寬表設計模型建立模型驗證通過小范圍調查,驗證模型的實際預測效果。在下述12個預測為家庭關系的號碼對中,經實際調查,有9對正確,3對錯誤,準確率為75%。姓名固話手機識別結果錯誤原因陳琳莉87****06153****7327正確

李俊犀87****87153****7678正確

昌國朋友187****70138****6785正確

昌國朋友287****27189****2572錯誤對應手機是固話朋友徐芳82****10135****1767正確

凱祥志84****38189****0099正確

張柳85****57133****0720錯誤未知陳琳莉同事185****50133****5727正確

陳琳莉同事284****46189****8989正確

陳琳莉同事384****23153****7778正確

陳琳莉同事487****98189****0037錯誤對應手機是固話堂弟龐敏61****31153****7912正確

精品資料

-16現狀背景模型目標建模步驟模型解讀(jiědú)應用價值目錄(mùlù)精品資料

-1790秒以內(yǐnèi)通話排名相互呼叫次數(cìshù)與最大相互呼叫次數(cìshù)的比值周末主叫次數排名90秒內通話次數與最大90秒內通話次數的比值當月被叫次數排名排名第一的號碼對,屬于家庭的概率為78.1%比值超過99%的號碼對,屬于家庭的概率為87.8%排名第一的號碼對,屬于家庭的概率為87.4%比值低于12.5%的,屬于非家庭的概率為95.7%排名非首位的號碼對,屬于非家庭的概率為81.6%不同的變量對于模型分類起著不同的作用,通過各變量的交叉判定,可以準確的預測出結果。變量重要性…… ………………精品資料-18判定決策樹及業務(yèwù)規則短時次數排名第一、主叫時長排名第一、周末(zhōumò)主叫次數排名第一、總呼叫次數占比超過99%、周中17-19點固話呼叫手機次數排名第一同時滿足上述條件的號碼對有1542對,其中符合家庭關系的占87.8%決策樹業務規則精品資料-19固話號碼手機號碼是否家庭關系判斷概率787211518955105685是0.9706726199213355511528是0.8921346671613966694966否0.9565517137413866754174是0.7762766149713349193152否0.8643757139013205606569否0.6818431317518905609494是0.8182將模型的分類規則(guīzé)作用于關系未知的【固話,手機】號碼對,可預測出其是否屬于家庭關系、以及判斷為該結果的概率。模型預測(yùcè)輸出結果精品資料-20現狀背景模型目標(mùbiāo)建模步驟模型解讀應用價值目錄(mùlù)精品資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論