




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
標(biāo)題:PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS原文:ABSTRACTConventionalstatisticalmethods(e.g.logisticsregression,decisiontree,andetc.)areverysuccessfulinpredictingcustomerchurn.However,thesemethodscouldhardlypredictwhencustomerswillchurn,orhowlongthecustomerswillstaywith.Thegoalofthisstudyistoapplysurvivalanalysistechniquestopredictcustomerchurnbyusingdatafromatelecommunicationscompany.Thisstudywillhelptelecommunicationscompaniesunderstandcustomerchurnriskandcustomerchurnhazardinatimingmannerbypredictingwhichcustomerwillchurnandwhentheywillchurn.Thefindingsfromthisstudyarehelpfulfortelecommunicationscompaniestooptimizetheircustomerretentionand/ortreatmentresourcesintheirchurnreductionefforts.INTRODUCTIONInthetelecommunicationindustry,customersareabletochooseamongmultipleserviceprovidersandactivelyexercisetheirrightsofswitchingfromoneserviceprovidertoanother.Inthisfiercelycompetitivemarket,customersdemandtailoredproductsandbetterservicesatlessprices,whileserviceprovidersconstantlyfocusonacquisitionsastheirbusinessgoals.Giventhefactthatthetelecommunicationsindustryexperiencesanaverageof30-35percentannualchurnrateanditcosts5-10timesmoretorecruitanewcustomerthantoretainanexistingone,customerretentionhasnowbecomeevenmoreimportantthancustomeracquisition.Formanyincumbentoperators,retaininghighprofitablecustomersisthenumberonebusinesspain.Manytelecommunicationscompaniesdeployretentionstrategiesinsynchronizingprogramsandprocessestokeepcustomerslongerbyprovidingthemwithtailoredproductsandservices.Withretentionstrategiesinplace,manycompaniesstarttoincludechurnreductionasoneoftheirbusinessgoals.Inordertosupporttelecommunicationscompaniesmanagechurnreduction,notonlydoweneedtopredictwhichcustomersareathighriskofchurn,butalsoweneedtoknowhowsoonthesehigh-riskcustomerswillchurn.Thereforethetelecommunicationscompaniescanoptimizetheirmarketinginterventionresourcestopreventasmanycustomersaspossiblefromchurning.Inotherwords,ifthetelecommunicationscompaniesknowwhichcustomersareathighriskofchurnandwhentheywillchurn,theyareabletodesigncustomizedcustomercommunicationandtreatmentprogramsinatimelyefficientmanner.Conventionalstatisticalmethods(e.g.logisticsregression,decisiontree,andetc.)areverysuccessfulinpredictingcustomerchurn.Thesemethodscouldhardlypredictwhencustomerswillchurn,orhowlongthecustomerswillstaywith.However,survivalanalysiswas,attheverybeginning,designedtohandlesurvivaldata,andthereforeisanefficientandpowerfultooltopredictcustomerchurn.OBJECTIVESTheobjectivesofthisstudyareintwofolds.Thefirstobjectiveistoestimatecustomersurvivalfunctionandcustomerhazardfunctiontogainknowledgeofcustomerchurnoverthetimeofcustomertenure.Thesecondobjectiveistodemonstratehowsurvivalanalysistechniquesareusedtoidentifythecustomerswhoareathighriskofchurnandwhentheywillchurn.DEFINITIONSANDEXCLUSIONSThissectionclarifiessomeoftheimportantconceptsandexclusionsusedinthisstudy.Churn–Inthetelecommunicationsindustry,thebroaddefinitionofchurnistheactionthatacustomer’stelecommunicationsserviceiscanceled.Thisincludesbothservice-providerinitiatedchurnandcustomerinitiatedchurn.Anexampleofservice-providerinitiatedchurnisacustomer’saccountbeingclosedbecauseofpaymentdefault.Customerinitiatedchurnismorecomplicatedandthereasonsbehindvary.Inthisstudy,onlycustomerinitiatedchurnisconsideredanditisdefinedbyaseriesofcancelreasoncodes.Examplesofreasoncodesare:unacceptablecallquality,morefavorablecompetitor’spricingplan,misinformationgivenbysales,customerexpectationnotmet,billingproblem,moving,changeinbusiness,andsoon.High-ValueCustomers–Onlycustomerswhohavereceivedatleastthreemonthlybillsareconsideredinthestudy.High-valuecustomersarethesewithmonthlyaveragerevenueof$Xormoreforthelastthreemonths.Ifacustomer’sfirstinvoicecoverslessthan30daysofservice,thenthecustomermonthlyrevenueisproratedtoafullmonth’srevenue.Granularity–Thisstudyexaminescustomerchurnattheaccountlevel.Exclusions–Thisstudydoesnotdistinguishinternationalcustomersfromdomesticcustomers.Howeveritisdesirabletoinvestigateinternationalcustomerchurnseparatelyfromdomesticcustomerchurninthefuture.Also,thisstudydoesnotincludeemployeeaccounts,sincechurnforemployeeaccountsisnotofaproblemoraninterestforthecompany.SURVIVALANALYSISANDCUSTOMERCHURNSurvivalanalysisisaclanofstatisticalmethodsforstudyingtheoccurrenceandtimingofevents.Fromthebeginning,survivalanalysiswasdesignedforlongitudinaldataontheoccurrenceofevents.Keepingtrackofcustomerchurnisagoodexampleofsurvivaldata.Survivaldatahavetwocommonfeaturesthataredifficulttohandlewithconventionalstatisticalmethods:censoringandtime-dependentcovariates.Generally,survivalfunctionandhazardfunctionareusedtodescribethestatusofcustomersurvivalduringthetenureofobservation.Thesurvivalfunctiongivestheprobabilityofsurvivingbeyondacertaintimepointt.However,thehazardfunctiondescribestheriskofevent(inthiscase,customerchurn)inanintervaltimeaftertimet,conditionalonthecustomeralreadysurvivedtotimet.Thereforethehazardfunctionismoreintuitivetouseinsurvivalanalysisbecauseitattemptstoquantifytheinstantaneousriskthatcustomerchurnwilltakeplaceattimetgiventhatthecustomeralreadysurvivedtotimet.Forsurvivalanalysis,thebestobservationplanisprospective.Webeginobservingasetofcustomersatsomewell-definedpointoftime(calledtheoriginoftime)andthenfollowthemforsomesubstantialperiodoftime,recordingthetimesatwhichcustomerchurnsoccur.It’snotnecessarythateverycustomerexperiencechurn(customerswhoareyettoexperiencechurnarecalledcensoredcases,whilethosecustomerswhoalreadychurnedarecalledobservedcases).Typically,notonlydowepredictthetimingofcustomerchurn,wealsowanttoanalyzehowtime-dependentcovariates(e.g.customerscallstoservicecenters,customerschangeplantypes,customerschangebillingoptions,andetc.)impacttheoccurrenceandtimingofcustomerchurn.SAS/STAThastwoproceduresforsurvivalanalysis:PROCLIFEREGandPROCPHREG.TheLIFEREGprocedureproducesparametricregressionmodelswithcensoredsurvivaldatausingmaximumlikelihoodestimation.ThePHREGprocedureisasemi-parametricregressionanalysisusingpartiallikelihoodestimation.PROCPHREGhasgainedpopularityoverPROCLIFEREGinthelastdecadesinceithandlestimedependent.Howeveriftheshapesofsurvivaldistributionandhazardfunctionareknown,PROCLIFEREGproducesmoreefficientestimates(withsmallerstandarderror)thanPROCPHREGdoes.SAMPLINGSTRATEGYOnAugust16,2000,asampleof41,374activehigh-valuecustomerswasrandomlyselectedfromtheentirecustomerbasefromatelecommunicationscompany.Allthesecustomerwerefollowedforthenext15months.ThereforeAugust16,2000istheoriginoftimeandNovember15,2001istheobservationterminationtime.Duringthis15-monthobservationperiod,thetimingofcustomerchurnwasrecorded.Foreachcustomerinthesample,avariableofDURisusedtoindicatethetimethatcustomerchurnoccurred,orforcensoredcases,thelasttimeatwhichcustomerswereobserved,bothmeasuredfromtheoriginoftime(August16,2000).AsecondvariableofSTATUSisusedtodistinguishthecensoredcasesfromobservedcases.ItiscommontohaveSTATUS=1forobservedcasesandSTATUS=0forcensoredcases.Inthisstudy,thesurvivaldataaresinglyrightcensoredsothatallthecensoredcaseshaveavalueof15(months)forthevariableDUR.DATASOURCESTherearefourmajordatasourcesforthisstudy:blocklevelmarketingandfinancialinformation,customerleveldemographicdataprovidedthroughathirdpartyvendor,customerinternaldata,andcustomercontactrecords.Abriefdescriptionofsomeofthedatasourcesfollows.DemographicData–Demographicdadaisfromathirdpartyvendor.Inthisstudy,thefollowingareexamplesofcustomerleveldemographicinformation:-Primaryhouseholdmember’sage-Genderandmaritalstatus-Numberofadults-Primaryhouseholdmember’soccupation-Householdestimatedincomeandwealthranking-Numberofchildrenandchildren’sage-Numberofvehiclesandvehiclevalue-Creditcard-Frequenttraveler-Respondertomailorders-DwellingandlengthofresidenceCustomerInternalData–Customerinternaldataisfromthecompany’sdatawarehouse.Itconsistsoftwoparts.Thefirstpartisaboutcustomerinformationlikemarketchannel,plantype,billagency,customersegmentationcode,ownershipofthecompany’sotherproducts,dispute,latefeecharge,discount,promotion/savepromotion,additionallines,tollfreeservices,rewardsredemption,billingdispute,andsoon.Thesecondpartofcustomerinternaldataiscustomer’stelecommunicationsusagedata.Examplesofcustomerusagevariablesare:-Weeklyaveragecallcounts-Percentagechangeofminutes-Shareofdomestic/internationalrevenueCustomerContactRecords–TheCompany’sCustomerInformationSystem(CIS)storesdetailedrecordsofcustomercontacts.Thisbasicallyincludescustomercallstoservicecentersandthecompany’smailcontactstocustomers.Thecustomercontactrecordsarethenclassifiedintocustomercontactcategories.Amongthecustomercontactcategoriesarecustomergeneralinquiry,customerrequeststochangeservice,customerinquiryaboutcancel,andsoon.MODELINGPROCESSModelprocessincludesthefollowingfourmajorsteps.ExplanatoryDataAnalysis(EDA)–Explanatorydataanalysiswasconductedtopreparethedataforthesurvivalanalysis.Anunivariatefrequencyanalysiswasusedtopinpointvaluedistributions,missingvaluesandoutliers.Variabletransformationwasconductedforsomenecessarynumericalvariablestoreducethelevelofskewness,becausetransformationsarehelpfultoimprovethefitofamodeltothedata.Outliersarefilteredtoexcludeobservations,suchasoutliersorotherextremevaluesthataresuggestednottobeincludedinthedatamininganalysis.Filteringextremevaluesfromthetrainingdatatendstoproducebettermodelsbecausetheparameterestimatesaremorestable.Variableswithmissingvaluesarenotabigissue,exceptforthosedemographicvariables.Thedemographicvariableswithmorethan20%ofmissingvalueswereeliminated.Forobservationswithmissingvalues,onechoiceistouseincompleteobservations,butthatmayleadtoignoreusefulinformationfromthevariablesthathavenonmissingvalues.Itmayalsobiasthesamplesinceobservationsthathavemissingvaluesmayhaveotherthingsincommonaswell.Therefore,inthisstudy,missingvalueswerereplacedbyappropriatemethods.Forintervalvariables,replacementvalueswerecalculatedbasedontherandompercentilesofthevariable’sdistribution,i.e.,valueswereassignedbasedontheprobabilitydistributionofthenonmissingobservations.Missingvaluesforclassvariableswerereplacedwiththemostfrequentvalues(countormode).Variablereduction–Startedwith212variablesintheoriginaldataset,byusingPROCFREQ,aninitialunivariateanalysisofallcategoricalvariablescrossedwithcustomerchurnstatus(STATUS)wascarriedouttodeterminethestatisticallysignificantcategoricalvariablestobeincludedinthenextmodelingstep.Allthecategoricalvariableswithachi-squarevalueortstatisticsof0.05orlesswerekept.Thisstepreducedthenumberofvariablesto115(&VARLIST1)–includingallthenumericalvariablesandthekeptcategoricalvariablesfromthestepone.ThenextstepistousePROCPHREGtofurtherreducethenumberofvariables.Astepwiseselectionmethodwasusedtocreateafinalmodelwithstatisticallysignificanteffectsof29exploratoryvariablesoncustomerchurnovertime.PROCPHREGDATA=SASOUT2.ALL2OUTEST=SASOUT2.BETA;MODELDUR*STATUS(0)=&VARLIST1/SELECTION=STEPWISESLENTRY=0.0025SLSTAY=0.0025DETAILS;ModelEstimation–Withonly29exploratoryvariables,thefinaldatasethasreasonablenumberofvariablestoperformsurvivalanalysis.Beforeapplyingsurvivalanalysisprocedurestothefinaldataset,thecustomersurvivalfunctionandhazardfunctionwereestimatedusingthefollowingcode.Thepurposeofestimatingcustomersurvivalfunctionandcustomerhazardfunctionistogainknowledgeofcustomerchurnhazardcharacteristics.Fromtheshapeofhazardfunction,customerchurninthisstudydemonstratesatypicalhazardfunctionofaLog-Normalmodel.Aspreviouslydiscussed,sincetheshapeofsurvivaldistributionandhazardfunctionwasknown,PROCLIFEREGproducesmoreefficientestimates(withsmallerstandarderror)thanPROCPHREGdoes.PROCLIFETESTDATA=SASOUT2.ALL3OUTSURV=SASOUT2.OUTSURVMETHOD=LIFEPLOT=(S,H)WIDTH=1GRAPHICS;TIMEDUR*STATUS(0);RUN;Thefinalstepistoestimatecustomerchurn.PROCLIFEREGwasusedtocalculatecustomersurvivalprobability.Atthisstepthefinaldatasetwasdivided50/50intotwodatasets:modeldatasetandvalidationdataset.Themodeldatasetisusedtofitthemodelandthevalidationdatasetisusedtoscorethesurvivalprobabilityforeachcustomer.AvariableofUSEisusedtodistinguishthemodeldataset(setUSE=0)andvalidationdataset(setUSE=1).Inthevalidationdataset,setbothDURandSTATUSmissingsothatcasesinthevalidationdatasetwerenottobeusedinmodelestimation.出處:JunXiangLu,Ph.D.PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS:SASUserGroupInternational(SUGI27)OnlineProceedings,2002,PaperNo.114-27.譯文:預(yù)測(cè)電信行業(yè)客戶流失——基于一種SAS生存分析模式的應(yīng)用程序JunXiangLu,Ph.D.SprintCommunicationsCompanyOverlandPark摘要傳統(tǒng)的統(tǒng)計(jì)方法(如logistic回歸,決策樹(shù)等等)都是能非常成功的預(yù)測(cè)客戶流失的。但是,這些方法是很難預(yù)測(cè)什么時(shí)候客戶會(huì)流失,或者這些客戶還能保留多久。這項(xiàng)研究的目的是運(yùn)用生存分析技術(shù)通過(guò)使用來(lái)自電信公司的數(shù)據(jù)來(lái)預(yù)測(cè)客戶流失。這項(xiàng)研究將會(huì)幫助電信公司了解客戶流失的風(fēng)險(xiǎn)和通過(guò)預(yù)測(cè)那些和何時(shí)客戶將要流失的一種時(shí)間方式的危害。這一研究的結(jié)果有助于電信公司優(yōu)化客戶的保留和(或)處理資源來(lái)努力降低他們的客戶流失。引言在電信行業(yè),客戶可以在多個(gè)提供服務(wù)的供應(yīng)者中進(jìn)行選擇,積極運(yùn)用他們從一個(gè)服務(wù)供應(yīng)商轉(zhuǎn)換到另一個(gè)供應(yīng)商的權(quán)利。在這個(gè)競(jìng)爭(zhēng)激烈的市場(chǎng),客戶需要用低價(jià)格獲得的按要求特質(zhì)非產(chǎn)品和更好的服務(wù),服務(wù)的供應(yīng)商要不斷的專注于收購(gòu)作為他們的業(yè)務(wù)目標(biāo)。鑒于電信業(yè)的經(jīng)驗(yàn)是30-35%的平均客戶流失率,開(kāi)發(fā)一個(gè)新客戶的成本是保留原有客戶成本的5-10倍。對(duì)于許多老牌的運(yùn)營(yíng)商,企業(yè)的主要頭痛的是留住高利潤(rùn)的客戶。許多電信公司在協(xié)調(diào)方案和過(guò)程時(shí)使用保持戰(zhàn)略通過(guò)提供量身定做的產(chǎn)品和服務(wù)來(lái)更長(zhǎng)時(shí)間的保持客戶。隨著各地方使用客戶保持戰(zhàn)略,很多公司開(kāi)始把降低客戶流失作為他們業(yè)務(wù)的目標(biāo)之一。為了支持電信企業(yè)管理客戶流失的減少,我們不僅需要預(yù)測(cè)那些客戶存在流失的高風(fēng)險(xiǎn),還需要知道什么時(shí)候這些高風(fēng)險(xiǎn)的客戶要流失。因此,電信公司優(yōu)化了其市場(chǎng)營(yíng)銷(xiāo)的資源來(lái)防止很多可能的客戶流失。換句話說(shuō),如果電信公司知道他們的客戶有流失的高風(fēng)險(xiǎn)和什么時(shí)候他們將要流失,他們就設(shè)計(jì)出與客戶即使有效的交流溝通的方案。傳統(tǒng)的統(tǒng)計(jì)方法(如logistic回歸,決策樹(shù)等等)都是能非常成功的預(yù)測(cè)客戶流失的。但是,這些方法是很難預(yù)測(cè)什么時(shí)候客戶會(huì)流失,或者這些客戶還能保留多久。然而,生存分析的最初設(shè)計(jì)是用于處理存在的數(shù)據(jù),因此是預(yù)測(cè)客戶流失的一種有效和強(qiáng)大的工具。目標(biāo)這項(xiàng)預(yù)測(cè)研究的目標(biāo)有兩個(gè)。第一個(gè)目標(biāo)是為了建立客戶生存函數(shù)和客戶風(fēng)險(xiǎn)函數(shù)來(lái)獲取在客戶的任期時(shí)間的客戶流失的知識(shí)。第二個(gè)目標(biāo)是演示用來(lái)識(shí)別那些是高風(fēng)險(xiǎn)流失的客戶和什么時(shí)候他們將要流失的生存分析技術(shù)。定義和排除本問(wèn)澄清一些重要的概念和排除在本次研究之外的使用。流失——在電信含有,客戶流失的廣泛定義是指一個(gè)客戶的電信服務(wù)被取消了。這包括服務(wù)提供者引發(fā)的客戶流失,和客戶主動(dòng)的流失。一個(gè)服務(wù)提供者引發(fā)的客戶流失的例子有客戶的賬戶因?yàn)榭蛻羟焚M(fèi)被關(guān)閉??蛻糁鲃?dòng)流失就比較復(fù)雜,流失的原因也是不同的。在這項(xiàng)研究中只研究客戶的主動(dòng)流失,它被定義為由一系列取消原因代碼,原因代碼的舉例有:不能接受通話質(zhì)量,競(jìng)爭(zhēng)對(duì)手的更優(yōu)惠的定價(jià)計(jì)劃,在銷(xiāo)售中誤傳了信息,客戶的期望得不到滿足,計(jì)費(fèi)問(wèn)題,移動(dòng),業(yè)務(wù)上的變化等等。高價(jià)值客戶——僅僅只那些已經(jīng)接受至少有三個(gè)月賬單的客戶。高價(jià)值客戶是那些在過(guò)去三個(gè)月每個(gè)月平均收益在x美元或以上的客戶。如果客戶的第一張發(fā)票少于30天的服務(wù),那么客戶的每個(gè)月的收益是按比例分配到一個(gè)整月的收入。尺度——本研究討論關(guān)于賬戶的客戶流失率排除——這項(xiàng)研究沒(méi)有區(qū)分國(guó)內(nèi)客戶和國(guó)際客戶,實(shí)際上把國(guó)際客戶流失從國(guó)內(nèi)客戶流失中分開(kāi)是值得做的。此外,這項(xiàng)研究不包括員工的賬戶,因?yàn)閱T工賬戶的流失不只是一個(gè)問(wèn)題或是企業(yè)的一種權(quán)利。生存分析和客戶流失生存分析是為學(xué)習(xí)發(fā)生的事情和實(shí)時(shí)的事件的一種統(tǒng)計(jì)研究方法。從一開(kāi)始,生存分析對(duì)發(fā)生的事件的設(shè)計(jì)縱向數(shù)據(jù)。對(duì)客戶流失的跟蹤時(shí)一個(gè)生存數(shù)據(jù)的很好的例子。生存數(shù)據(jù)有兩個(gè)共同的特點(diǎn),很難用傳統(tǒng)的統(tǒng)計(jì)方法處理:審查和時(shí)間上的依賴性變量。一般情況下,生存函數(shù)和風(fēng)險(xiǎn)函數(shù)是用來(lái)描述在任期間觀察客戶存在的狀態(tài)。生存函數(shù)給出了超過(guò)一定時(shí)間t的存在概率,而風(fēng)險(xiǎn)寒素描述在間隔時(shí)間t的事件風(fēng)險(xiǎn)(在這種情況下,客戶流失)在時(shí)間t后的一段間隔時(shí)間,在時(shí)間t中考慮已經(jīng)生存下來(lái)的客戶。因此,風(fēng)險(xiǎn)功能更直觀的在生存分析中的使用,因?yàn)樗噲D把風(fēng)險(xiǎn)量化,客戶流失將在這個(gè)客戶存貨的時(shí)間t內(nèi)發(fā)生。為了生存分析,最佳觀測(cè)計(jì)劃是有前瞻性,我開(kāi)始觀測(cè)在一些時(shí)間定義的明確點(diǎn)(成為時(shí)間的起源)的客戶集,然后按照相當(dāng)長(zhǎng)的一段時(shí)間記錄在那時(shí)間所發(fā)生的客戶流失。每個(gè)客戶體驗(yàn)流失(客戶沒(méi)有體驗(yàn)流失被稱為審查情況,這些客戶已經(jīng)流失的稱為觀察情況)是不必要的。通常情況下,我們不僅預(yù)測(cè)客戶流失的時(shí)間,我們也需要分析如何隨著時(shí)間變化(如客戶服務(wù)呼叫中心,客戶變更計(jì)劃類型,客戶改變結(jié)算方式等)發(fā)生和時(shí)間影響流失的客戶。SAS/STAT對(duì)生存分析有兩個(gè)程序:LIFEREG程序和PHREG程序。LIFEREG程序產(chǎn)生的參數(shù)回歸模式對(duì)生存分析的數(shù)據(jù)使用最大可能的估計(jì)。PHREG過(guò)程時(shí)一個(gè)半?yún)?shù)回歸分析使用部分可能的估計(jì)。PHREG程序在過(guò)去的十年里依賴它處理的時(shí)間性,已經(jīng)獲得了的普及超過(guò)LIFEREG程序。但是,如果生存分布和風(fēng)險(xiǎn)函數(shù)的形狀是已知的,LIFEREG程序比PHREG程序更有效的估計(jì)(標(biāo)準(zhǔn)誤差較?。?。抽樣策略2000年8月16日,41374活動(dòng)的高價(jià)值客戶的樣本是從整個(gè)電信公司的客戶群中隨機(jī)挑選的。所有的客戶在未來(lái)的15個(gè)月的跟隨,2000年8月16日是時(shí)間的起點(diǎn),2001年11月15日時(shí)觀察的終止時(shí)間。在這15個(gè)月的觀察期,客戶流失的時(shí)間被記錄。對(duì)于樣本中的每一個(gè)客戶,一個(gè)變量的總指數(shù)是用來(lái)表示在客戶流失情況或者審查情況下的時(shí)間,最后一次客戶進(jìn)行觀察,從開(kāi)始的時(shí)間(2000年8月16日)進(jìn)行測(cè)量。第二個(gè)變量狀態(tài)是用來(lái)區(qū)分審查情況和觀察情況的。在觀察情況下?tīng)顟B(tài)=1和在審查情況下?tīng)顟B(tài)=0都是常見(jiàn)的。在這項(xiàng)研究中,生存數(shù)據(jù)是單獨(dú)正確的審查情況,所有的審查情況有15個(gè)(月)有價(jià)值的總指數(shù)為變量值。資料來(lái)源這里有四個(gè)主要數(shù)據(jù)來(lái)源的研究:數(shù)據(jù)營(yíng)銷(xiāo)和財(cái)務(wù)信息,客戶水平,通過(guò)第三方的供應(yīng)商提供的人口統(tǒng)計(jì)數(shù)據(jù),客戶內(nèi)部數(shù)據(jù)和客戶聯(lián)系記錄。一個(gè)數(shù)據(jù)源的一些簡(jiǎn)要說(shuō)明如下。人口數(shù)據(jù)——人口數(shù)據(jù)時(shí)來(lái)自第三方的廠商。在這項(xiàng)研究中,以下是客戶級(jí)別的人口信息的例子:小學(xué)家庭成員的年齡性別和婚姻狀況成人人數(shù)小學(xué)家庭成員的職業(yè)家用估計(jì)收入和財(cái)富排名兒童和兒童人數(shù)的年齡車(chē)輛輛數(shù)和車(chē)輛價(jià)值信用卡頻繁游客有響應(yīng)的郵件訂單住宅與居住期限客戶內(nèi)部數(shù)據(jù)——客戶內(nèi)部數(shù)據(jù)是從該公司的數(shù)據(jù)倉(cāng)庫(kù)得到的。它由兩部分組成。第一部分是關(guān)于客戶如市場(chǎng)渠道,計(jì)劃的類型,票據(jù)代理,客戶細(xì)分的代碼,該公司的其他產(chǎn)品的所有權(quán),糾紛,滯納金費(fèi)用,折扣,促銷(xiāo)信息/保存推廣,額外的線路,免費(fèi)服務(wù),獎(jiǎng)勵(lì)贖回,結(jié)算糾紛等等。對(duì)客戶內(nèi)部數(shù)據(jù)的第二個(gè)部分是客戶的電信使用數(shù)據(jù)。客戶使用變量的例子有:每周平均通話次數(shù)會(huì)議紀(jì)要變動(dòng)百分率應(yīng)占的國(guó)內(nèi)/國(guó)際業(yè)務(wù)收入客戶聯(lián)系記錄——該公司的客戶信息系統(tǒng)(CIS)存儲(chǔ)客戶接觸的詳細(xì)記錄。這基本上包括客戶呼叫服務(wù)中心和公司的郵件往來(lái)的客戶??蛻袈?lián)系記錄為客戶聯(lián)系的類別分類。其中客戶聯(lián)系客戶類別有一般查詢,客戶要求變更服務(wù),客戶查詢有關(guān)取消等等。模型建立過(guò)程模型建立的過(guò)程包括以下四個(gè)主要步驟。說(shuō)明資料分析(EDA)——說(shuō)明數(shù)據(jù)進(jìn)行分析,以備生存分析的數(shù)據(jù)。一個(gè)的頻率分析被使用于精確值分布,遺漏值和離群值。變量變換進(jìn)行了一些必要的數(shù)字變量,以減少偏度水平,因?yàn)橛欣谔岣咿D(zhuǎn)換一種模式適合數(shù)據(jù)。離群的篩選,以排除如離群或其他不建議在數(shù)據(jù)挖掘分析包括極端值的觀察。從訓(xùn)練數(shù)據(jù)篩選極端值往往會(huì)產(chǎn)生更好的模型,因?yàn)閰?shù)估計(jì)更穩(wěn)定。變量有遺漏值不是一個(gè)大問(wèn)題,除了這些人口統(tǒng)計(jì)變數(shù)。超過(guò)20%的人口遺漏值的變量被淘汰。對(duì)于遺漏值的觀察,一個(gè)選擇是使用不完整的意見(jiàn),但可能導(dǎo)致忽略的變量有沒(méi)有遺漏價(jià)值的有用信息。它也可能帶有偏見(jiàn)的誤差樣本,因?yàn)橐庖?jiàn)有遺漏值在其他中可能有共同的東西。因此,在這項(xiàng)研究中,遺漏值改為適當(dāng)?shù)姆椒?。?duì)于區(qū)間變量,重置價(jià)值計(jì)算依據(jù)變量的分布,即價(jià)值被分配的基礎(chǔ)上,在沒(méi)有遺漏觀測(cè)概率分布的隨機(jī)百分點(diǎn)。為類變量遺漏值被替換最頻繁值(計(jì)數(shù)或模式)。減少變項(xiàng)——212中的原始數(shù)據(jù)集的變量使用了FREQ程序,初步的交叉與客戶的所有分類變量單因素分析,流失狀態(tài)進(jìn)行了以決定在未來(lái)包括分類變量顯著建模步驟。所有一卡方值的分類變量或t為0.05統(tǒng)計(jì)或更小統(tǒng)計(jì)分類變量統(tǒng)統(tǒng)保留。這一步變量的數(shù)目減少了115(&變量1)---包括所有的數(shù)字變量,從一個(gè)步驟保持絕對(duì)的變數(shù)。接下來(lái)的步驟是使用PHREG程序進(jìn)一步減少變數(shù)。一個(gè)逐步選擇方法被用于創(chuàng)建與探索29客戶顯著影響一個(gè)變量的最終模型隨著時(shí)間的推移流失。PHREG程序數(shù)據(jù)=SASOUT2.ALL2OUTEST=SASOUT2.;指數(shù)模型*狀態(tài)(0)=&變量/選擇=遞進(jìn)SLENTRY=0.0025SLSTAY=0.0025詳情;模型的估計(jì)——只有29探索變量,最終的數(shù)據(jù)集有合理數(shù)量的變量進(jìn)行生存分析。在申請(qǐng)程序,以存活分析最終數(shù)據(jù)集,客戶生存函數(shù)和風(fēng)險(xiǎn)函數(shù)估計(jì)采用下面的代碼。顧客的生存函數(shù)估計(jì)和客戶風(fēng)險(xiǎn)函數(shù)的目的是為了獲取客戶知識(shí)流失的危險(xiǎn)特性。從風(fēng)險(xiǎn)函數(shù)的形,狀,這項(xiàng)研究的客戶流失是對(duì)數(shù)正態(tài)模型典型的風(fēng)險(xiǎn)函數(shù)。如前所述,由于生存分布和危害函數(shù)的形狀是眾所周知的LIFEREG程序比PHREG程序的估計(jì)數(shù)(標(biāo)準(zhǔn)誤差較小)更有效。LIFETEST程序數(shù)據(jù)=SASOUT2.ALL3OUTSURVSASOUT2.OUTSURV方法=上升容積=(面積,高)寬=1圖形;時(shí)間總指數(shù)*狀態(tài)(0);運(yùn)行;最后一步是評(píng)估客戶流失。LIFEREG程序是用來(lái)計(jì)算客戶的生存概率。在這一步最后的數(shù)據(jù)集被分成50/50的兩組數(shù)據(jù):模型數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集。該模型的數(shù)據(jù)集是用于擬合模型和驗(yàn)證數(shù)據(jù)集是用于評(píng)分為每一個(gè)客戶的生存概率。USE的一個(gè)變量是用來(lái)區(qū)分模型數(shù)據(jù)集(設(shè)置使用=0)和驗(yàn)證數(shù)據(jù)集(設(shè)置使用=1)。在驗(yàn)證數(shù)據(jù)集,總指數(shù)和狀態(tài)都設(shè)置失蹤,以便在驗(yàn)證數(shù)據(jù)集是不能在模型的估計(jì)使用。出處:JunXiangLu,Ph.D.PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS:SASUserGroupInternational(SUGI27)OnlineProceedings.2002,PaperNo.114-27,基于C8051F單片機(jī)直流電動(dòng)機(jī)反饋控制系統(tǒng)的設(shè)計(jì)與研究基于單片機(jī)的嵌入式Web服務(wù)器的研究MOTOROLA單片機(jī)MC68HC(8)05PV8/A內(nèi)嵌EEPROM的工藝和制程方法及對(duì)良率的影響研究基于模糊控制的電阻釬焊單片機(jī)溫度控制系統(tǒng)的研制基于MCS-51系列單片機(jī)的通用控制模塊的研究基于單片機(jī)實(shí)現(xiàn)的供暖系統(tǒng)最佳啟停自校正(STR)調(diào)節(jié)器單片機(jī)控制的二級(jí)倒立擺系統(tǒng)的研究基于增強(qiáng)型51系列單片機(jī)的TCP/IP協(xié)議棧的實(shí)現(xiàn)基于單片機(jī)的蓄電池自動(dòng)監(jiān)測(cè)系統(tǒng)基于32位嵌入式單片機(jī)系統(tǒng)的圖像采集與處理技術(shù)的研究基于單片機(jī)的作物營(yíng)養(yǎng)診斷專家系統(tǒng)的研究基于單片機(jī)的交流伺服電機(jī)運(yùn)動(dòng)控制系統(tǒng)研究與開(kāi)發(fā)基于單片機(jī)的泵管內(nèi)壁硬度測(cè)試儀的研制基于單片機(jī)的自動(dòng)找平控制系統(tǒng)研究基于C8051F040單片機(jī)的嵌入式系統(tǒng)開(kāi)發(fā)基于單片機(jī)的液壓動(dòng)力系統(tǒng)狀態(tài)監(jiān)測(cè)儀開(kāi)發(fā)模糊Smith智能控制方法的研究及其單片機(jī)實(shí)現(xiàn)一種基于單片機(jī)的軸快流CO〈,2〉激光器的手持控制面板的研制基于雙單片機(jī)沖床數(shù)控系統(tǒng)的研究基于CYGNAL單片機(jī)的在線間歇式濁度儀的研制基于單片機(jī)的噴油泵試驗(yàn)臺(tái)控制器的研制基于單片機(jī)的軟起動(dòng)器的研究和設(shè)計(jì)基于單片機(jī)控制的高速快走絲電火花線切割機(jī)床短循環(huán)走絲方式研究基于單片機(jī)的機(jī)電產(chǎn)品控制系統(tǒng)開(kāi)發(fā)基于PIC單片機(jī)的智能手機(jī)充電器基于單片機(jī)的實(shí)時(shí)內(nèi)核設(shè)計(jì)及其應(yīng)用研究基于單片機(jī)的遠(yuǎn)程抄表系統(tǒng)的設(shè)計(jì)與研究基于單片機(jī)的煙氣二氧化硫濃度檢測(cè)儀的研制基于微型光譜儀的單片機(jī)系統(tǒng)單片機(jī)系統(tǒng)軟件構(gòu)件開(kāi)發(fā)的技術(shù)研究基于單片機(jī)的液體點(diǎn)滴速度自動(dòng)檢測(cè)儀的研制基于單片機(jī)系統(tǒng)的多功能溫度測(cè)量?jī)x的研制基于PIC單片機(jī)的電能采集終端的設(shè)計(jì)和應(yīng)用基于單片機(jī)的光纖光柵解調(diào)儀的研制氣壓式線性摩擦焊機(jī)單片機(jī)控制系統(tǒng)的研制基于單片機(jī)的數(shù)字磁通門(mén)傳感器基于單片機(jī)的旋轉(zhuǎn)變壓器-數(shù)字轉(zhuǎn)換器的研究基于單片機(jī)的光纖Bragg光柵解調(diào)系統(tǒng)的研究單片機(jī)控制的便攜式多功能乳腺治療儀的研制基于C8051F020單片機(jī)的多生理信號(hào)檢測(cè)儀基于單片機(jī)的電機(jī)運(yùn)動(dòng)控制系統(tǒng)設(shè)計(jì)Pico專用單片機(jī)核的可測(cè)性設(shè)計(jì)研究基于MCS-51單片機(jī)的熱量計(jì)基于雙單片機(jī)的智能遙測(cè)微型氣象站MCS-51單片機(jī)構(gòu)建機(jī)器人的實(shí)踐研究基于單片機(jī)的輪軌力檢測(cè)基于單片機(jī)的GPS定位儀的研究與實(shí)現(xiàn)基于單片機(jī)的電液伺服控制系統(tǒng)用于單片機(jī)系統(tǒng)的MMC卡文件系統(tǒng)研制基于單片機(jī)的時(shí)控和計(jì)數(shù)系統(tǒng)性能優(yōu)化的研究基于單片機(jī)和CPLD的粗光柵位移測(cè)量系統(tǒng)研究單片機(jī)控制的后備式方波UPS提升高職學(xué)生單片機(jī)應(yīng)用能力的探究基于單片機(jī)控制的自動(dòng)低頻減載裝置研究基于單片機(jī)控制的水下焊接電源的研究基于單片機(jī)的多通道數(shù)據(jù)采集系統(tǒng)基于uPSD3234單片機(jī)的氚表面污染測(cè)量?jī)x的研制基于單片機(jī)的紅外測(cè)油儀的研究96系列單片機(jī)仿真器研究與設(shè)計(jì)基于單片機(jī)的單晶金剛石刀具刃磨設(shè)備的數(shù)控改造基于單片機(jī)的溫度智能控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)基于MSP430單片機(jī)的電梯門(mén)機(jī)控制器的研制基于單片機(jī)的氣體測(cè)漏儀的研究基于三菱M16C/6N系列單片機(jī)的CAN/USB協(xié)議轉(zhuǎn)換器基于單片機(jī)和DSP的變壓器油色譜在線監(jiān)測(cè)技術(shù)研究基于單片機(jī)的膛壁溫度報(bào)警系統(tǒng)設(shè)計(jì)基于AVR單片機(jī)的低壓無(wú)功補(bǔ)償控制器的設(shè)計(jì)基于單片機(jī)船舶電力推進(jìn)電機(jī)監(jiān)測(cè)系統(tǒng)基于單片機(jī)網(wǎng)絡(luò)的振動(dòng)信號(hào)的采集系統(tǒng)基于單片機(jī)的大容量數(shù)據(jù)存儲(chǔ)技術(shù)的應(yīng)用研究基于單片機(jī)的疊圖機(jī)研究與教學(xué)方法實(shí)踐基于單片機(jī)嵌入式Web服務(wù)器技術(shù)的研究及實(shí)現(xiàn)基于AT89S52單片機(jī)的通用數(shù)據(jù)采集系統(tǒng)基于單片機(jī)的多道脈沖幅度分析儀研究機(jī)器人旋轉(zhuǎn)電弧傳感角焊縫跟蹤單片機(jī)控制系統(tǒng)基于單片機(jī)的控制系統(tǒng)在PLC虛擬教學(xué)實(shí)驗(yàn)中的應(yīng)用研究基于單片機(jī)系統(tǒng)的網(wǎng)絡(luò)通信研究與應(yīng)用基于PI
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 雙方約定協(xié)議書(shū)格式
- 監(jiān)測(cè)公司協(xié)議書(shū)范本
- 景區(qū)開(kāi)發(fā)土地協(xié)議書(shū)
- 賬戶過(guò)賬免責(zé)協(xié)議書(shū)
- 彝族遷墳協(xié)議書(shū)范本
- 診所護(hù)士聘用協(xié)議書(shū)
- 兄弟房屋賣(mài)賣(mài)協(xié)議書(shū)
- 老人婚前約定協(xié)議書(shū)
- 融資租賃協(xié)議書(shū)樣本
- 毆打和解協(xié)議書(shū)范本
- JJG 539-2016數(shù)字指示秤
- JJF 1183-2007溫度變送器校準(zhǔn)規(guī)范
- GB/T 8642-2002熱噴涂抗拉結(jié)合強(qiáng)度的測(cè)定
- GB/T 19289-2019電工鋼帶(片)的電阻率、密度和疊裝系數(shù)的測(cè)量方法
- GB 3150-2010食品安全國(guó)家標(biāo)準(zhǔn)食品添加劑硫磺
- 沼氣發(fā)電項(xiàng)目建議書(shū)
- 大學(xué)物理上總復(fù)習(xí)課件
- 施工進(jìn)場(chǎng)通知書(shū)
- 幼兒園小班科學(xué)藝術(shù):《歡樂(lè)的小芽?jī)骸?課件
- 子宮肌瘤課件PPT(共38張PPT)
- 《學(xué)前教育科學(xué)研究方法》全套課件(完整版)
評(píng)論
0/150
提交評(píng)論