市場營銷中的數據方法_第1頁
市場營銷中的數據方法_第2頁
市場營銷中的數據方法_第3頁
市場營銷中的數據方法_第4頁
市場營銷中的數據方法_第5頁
已閱讀5頁,還剩68頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

市場營銷中的數據分析方法報告內容原理篇客戶關系管理中的數量方法方法篇數據分析方法概論統計分析方法數據挖掘分析方法工具篇常用數據分析工具簡介總結基本結論市場營銷中的數量決策問題傳統的純粹定性描述方法已遠遠不能滿足現代市場營銷實踐的需要,為了體現市場營銷學本身的科學性和對企業實踐的指導性,數據分析理論與方法在市場營銷學中占有越來越重要的地位。理論上->計量市場營銷學的出現理念上->數據庫營銷、關系營銷的興起實務上->數據挖掘技術在客戶關系管理中的應用探察數量決策問題的兩個視角理論上的框架要素實務上的業務流程視角一:市場營銷學的理論框架

核心概念營銷觀念營銷計劃營銷組織營銷控制營銷審計產品策略定價策略分銷策略促銷策略需求分析市場細分目標市場市場定位基礎理論戰略理論策略理論管理理論視角一示例:市場營銷中的產品決策產品定位定位圖分析(感知定位圖、偏好定位圖等)新產品擴散與產品生命周期管理巴斯模型(BASSModel)生長曲線模型(GrowthCurveModel)品牌決策消費者品牌選擇模型視角二示例:電信業業務流程視圖(eTOM)運營實施保障計費運營支撐與就緒客戶關系管理服務管理與運營資源管理與運營供應商/合作伙伴關系管理(應用,計算與網絡)企業管理戰略與企業規劃財務與資產管理企業質量管理管理,過程與IT規劃&架構股東與外部關系管理品牌管理,市場研究&廣告人力資源管理災難恢復,安全&欺詐管理研究與開發,技術獲取戰略,基礎設施&產品產品周期管理基礎設施生命周期管理戰略與承諾營銷&產品提供管理服務開發與管理資源開發與管理供應鏈開發與管理(應用,計算與網絡)客戶視角二示例:理解客戶與市場市場購買行為消費者購買行為模型消費者品牌選擇模型市場需求測量市場需求預測模型市場細分客戶生命周期與市場營銷策略客戶生命周期在不同生命周期階段需考慮不同問題如何發現并獲取潛在客戶?階段A(Acquisition)客戶獲取如何把客戶培養成高價值客戶?階段B:(Build-up)客戶提升如何使客戶使用新電信產品?如何培養顧客忠誠度?階段C:(Climax)客戶成熟如何延長客戶“生命周期”?階段D:(Decline)客戶衰退如何贏回客戶?階段E:(Exit)客戶離網客戶價值多種分析主題在不同時期應用客戶獲取市場細分與產品定位目標客戶特征識別刺激需求提升銷售交叉銷售目標營銷客戶保持生存分析客戶風險客戶挽留客戶細分細分是指將一個大的消費群體劃分成一個個細分群的動作,同屬于一個細分群的消費者彼此相似,而隸屬于不同細分群的消費者被視為不同。細分的目的可以讓管理者從一個比較高的層次上“鳥瞰”整個數據庫中的數據,從而可以用不同的方法對待處于不同細分群眾的客戶,提供相對個性化的服務。客戶細分的目的更好的了解客戶結構改善客戶管理與溝通增加客戶貢獻度客戶細分中的數量方法聚類分析卡方自動交互檢測(CHAID)營銷策略客戶保持基于獎賞及高成本事件驅動的保持策略專注的,區分優先級的Callcenter支持客戶獲取刻畫子分群的特征建立跟蹤系統(trackingsystems)以從價值的角度監控新來的客戶交叉銷售對高價值客戶進行交叉銷售會產生更大的收益經常地,頭20%的客戶貢獻了將近100%的整體利潤.這些客戶對CRM策略開發是至關重要的。示例:基于價值的客戶細分(高價值客戶)中間間層層代代表表了了客客戶戶的的大大多多數數.他們們利利潤潤較較薄薄((thinmargins)但但容容量量巨巨大大((highvolume).營銷銷策策略略定價價與與行行為為改改變變識別別服服務務機機會會–增強強可可能能的的定定價價結構構性性定定價價以以鼓鼓勵勵改改善善收收益益性性的的行行為為交叉叉銷銷售售利用用預預測測模模型型識識別別具具有有潛潛在在價價值值的的客客戶戶利用用事事件件營營銷銷與與關關系系營營銷銷策策略略去去增增加加產產品品的的持持有有量量渠道道與與服服務務的的效效率率識別別高高成成本本/低回回報報的的渠渠道道并并重重新新部部署署或或調調整整結結構構定位位高高成成本本業業務務流流程程以以流流線線化化或或渠渠道道遷遷移移示例例::基基于于價價值值的的客客戶戶細細分分((中中價價值值客客戶戶))盡管管數數量量很很少少(10%to20%)但他他們們消消除除了了很很大大一一部部分分的的利利潤潤.營銷銷策策略略改變變定定價價識別別與與負負利利潤潤相相關關的的定定價價策策略略與與行行為為,鼓勵勵服服務務使使用用與與目目標標定定價價以以增增加加或或引引入入由由服服務務改改變變而而帶帶來來的的可可能能收收入入客戶戶風風險險避免免向向具具有有信信用用風風險險的的客客戶戶進進行行交交叉叉銷銷售售客戶戶獲獲取取識別別低低價價值值客客戶戶并并積積極極地地在在獲獲取取過過程程中中避避免免與與這這類類客客戶戶發發生生接接觸觸示例例::基基于于價價值值的的客客戶戶細細分分((低低價價值值客客戶戶))RetirementAgeChildrenIndependentWealthAccumulationFirstChildFirstHomePre-RetirementCareerLaunchIndependenceFinancialDebutEmploymentChangeMarriageHighValue??HighValue??LowValue??LowValue??示例例::基基于于生生命命階階段段的的客客戶戶細細分分客戶戶獲獲取取在大大多多數數商商業業領領域域中中,,業業務務發發展展的的主主要要指指標標里里包包括括新新客客戶戶的的獲獲取取能能力力。。新新客客戶戶的的獲獲取取包包括括發發現現那那些些對對你你的的產產品品不不了了解解的的客客戶戶,,也也包包括括以以前前接接受受你你的的競競爭爭對對手手服服務務的的顧顧客客。。客戶戶獲獲取取中中的的數數量量方方法法特征征識識別別((ProfilingandPenetrationAnalysis)響應應模模型型((ResponseModel)客戶戶保保持持隨著著行行業業的的競競爭爭越越來來越越激激烈烈和和獲獲得得一一個個新新客客戶戶的的開開支支愈愈來來愈愈大大,,保保持持原原有有客客戶戶的的工工作作愈愈來來愈愈有有價價值值。。客戶戶保保持持中中的的數數量量方方法法流失失預預測測模模型型客戶戶忠忠誠誠度度模模型型交叉叉銷銷售售與與提提升升銷銷售售交叉叉營營銷銷是是指指你你向向現現有有的的客客戶戶提提供供新新的的產產品品和和服服務務的的營營銷銷過過程程。。公公司司與與其其客客戶戶之之間間的的商商業業關關系系是是一一種種持持續續的的不不斷斷發發展展的的關關系系,,在在這這種種關關系系建建立立起起來來以以后后,,可可以以有有很很多多種種方方法法來來不不斷斷改改善善這這種種關關系系。。雙雙方方的的目目標標是是達達到到雙雙贏贏的的結結果果,,客客戶戶獲獲益益是是由由于于他他們們得得到到了了更更好好更更貼貼切切的的服服務務質質量量,,商商家家則則因因為為增增加加銷銷售售量量獲獲利利。。交叉銷售中的的數量方法購買傾向預測測產品關聯分析析客戶流失客戶流失預警警分品牌、高/中/低價值、主動動/被動構建模型型分類預測數據據挖掘模型客戶挽留流程程設計彩鈴客戶流失失預警分主動/捆綁構建模型型分類預測數據據挖掘模型客戶挽留流程程設計競爭對手流失失預警聯通用戶流失失預測客戶挽留流程程設計交叉銷售與提提升銷售購買傾向預測測彩鈴預測模型型彩信預測模型型WAP預測模型購物藍分析產品關聯分析析營銷方案關聯聯分析提升銷售價值提升預測測模型營銷案預演營銷預演是為為了支持業務務人員制訂新新的資費營銷銷方案,然后后對該方案在在歷史數據上上做相應的測測算,從而根根據測算結果果來指導下一一步工作。營銷活動管理理-CMP需求名稱:營銷活動管理(CMP)提出時間:2006-01-01需求提出部門:市場部需求內容描述:營銷活動管理。通過系統分析定位目標營銷的客戶群,并自動生成客戶群信息進行管理,通過實時跟蹤客戶的營銷情況進行營銷策略的調整,并監控渠道銷售信息。同時營銷活動完成以后進行營銷活動的評估。需求時間計劃:計劃06年7月前完成東莞、佛山地市的推廣。需求數據要求:目前系統數據支撐需求優先級別:高需求實施難度:較高要求配合部門:業務支撐中心、客戶服務部其他說明:全省推廣需求,劉鵬負責

需求分析和定位:屬于05年的需求,已經納入日常維護,今年需要推廣。根據省公司的統一規劃安排。省公司時間規劃:2006年上半年完成省、市二級規劃,東莞和佛山推廣2006年上半年完成三個事件營銷KPI預測模型需求名稱:KPI預測模型提出時間:2006-02-23需求提出部門:東莞公司需求內容描述:KPI指標中的收入指標作為核心指標,規劃和預測十分重要。而收入受營銷政策與執行的影響較大,傳統的歷史曲線預測方法與手段不能準確預測當期及下期的收入。實現邏輯:將當期營收款細拆為“當期收入”(如購卡收入、補換卡收入、后付費收入等)與“分期劃扣收入”(充值卡收入、營銷活動預存款收入等)兩個部分。“當期收入”非常穩定,只受季節因素影響,“分期劃扣收入”結合號碼級數據的消費ARPU可以較為方便地預演推算。推廣過去,針對KPI指標的重要指標(如收入、業務量等)都可以進行規劃和預測,有效的幫助各部門制定相關的政策策略。需求時間計劃:無需求數據要求:目前系統數據支撐。需求優先級別:需求級別待定。需求實施難度:高要求配合部門:業務支撐中心、市場部其他說明:區域接口人負責(劉鵬)需求分析和定位:需求可行,可以通過邏輯回歸構建模型實現,具體的建設方案需要與相關人員進行細化和確認。個人客戶分群群需求名稱:個人客戶分群提出時間:2006-02-23需求提出部門:佛山公司需求內容描述:每個人作為消費者其對同一種產品的具體功能需求和關注點是不同的,因此作為為用戶服務的企業,必須盡可能的考慮這些差異,發現這些存在于客戶整體內部的具有不同特征或消費習慣的客戶群體,然后再根據每個群體的特征執行針對性的管理或營銷策略。將這個把客戶分成不同群體的過程稱之為“客戶分群”。通過對客戶合理的類別劃分,并對當前客戶以及預期的客戶群作區段分析,判斷不同區段的突出特點,對客戶總體構成有準確的認識,對客戶的服務和營銷更具針對性。對客戶分群可以達到如下目標:了解客戶的總體構成了解各種客戶價值的客戶群體特征了解流失客戶的客戶群體特征了解使用各種套餐的客戶群體特征了解各消費等級的客戶群體特征需求時間計劃:無需求數據要求:目前系統數據支撐。需求優先級別:中等需求實施難度:中等要求配合部門:業務支撐中心、市場部、數據業務中心其他說明:區域接口人負責(劉敏)需求分析和定位:需求可行。客戶分類/聚類是根據一個或多個客戶屬性組合把所有客戶劃分成不同的類,同類內的客戶具有最大的相似性,異類間的客戶具有最大的差異性。通過對客戶合理的類別劃分,并對當前客戶以及預期的客戶群作區段分析,判斷不同區段的突出特點,對客戶總體構成有準確的認識,對客戶的服務和營銷更具針對性。對于各種業務(新業務)可以單獨進行客戶的細分,也可按照各種業務的綜合指標進行客戶細分,使市場營銷更具針對性。個人客戶價值值評估需求名稱:個人客戶價值評估提出時間:2006-02-23需求提出部門:市場部需求內容描述:有區別的看待個人客戶的差異性,觀察其價值特征變化,綜合考慮成本,用戶成長度,客戶消費等因素,通過建模量化個人客戶對公司的貢獻和價值。客戶價值包括客戶貢獻與客戶成本兩個側面,對于前者,客戶的帳單金額已是很好的衡量指標,但是也需要綜合考慮其他指標(如新業務使用情況、長途或者漫游比例等);而對于后者,由于利用財務數據進行分攤或者活動單位成本進行直接計算還需時日(等待財務部的成本分攤工作完成),故當前階段是處理貢獻類相關指標以供用戶直觀考察。需求時間計劃:06年3月廣州數據集市試點需求數據要求:目前系統數據支撐需求優先級別:高需求實施難度:高要求配合部門:業務支撐中心、財務部其他說明:負責人待定需求分析和定位:個人客戶價值如果考慮成本分攤,需要等財務部開展的成本分攤完成后才能考慮到地市的實施。新產品生命周周期分析需求名稱:新產品生命周期分析提出時間:2006-02-23需求提出部門:數據業務中心需求內容描述:目前地市沒有明確和急需的需求,只是有個這樣的概念和初步的想法。省公司想法是作為一個科研項目來研究和分析,希望能研究一些成果幫助市公司的市場分析和營銷策略。需求時間計劃:根據省公司的統一規劃安排。需求數據要求:目前系統數據支撐需求優先級別:高需求實施難度:高要求配合部門:業務支撐中心、市場部其他說明:試點科研項目,鄧逸斌、劉鵬負責需求分析和定位:題目比較難,優先級別比較高,先按照省公司的思路和計劃安排走。初步思路進行兩個方面的研究:現有新業務產品的生命周期曲線研究本研究的內容主要包括構建產品生命周期曲線預測模型并基于相關產品展開數據實證研究,同時對實證結果進行有效的業務解釋并形成合理的政策建議。2.新業務產品生命周期變遷之關鍵績效指標的研究本研究的內容主要包括分析并總結產品生命周期變遷過程中對階段性轉折點具有前瞻警示作用的業務指標,并在此基礎之上構建切實可行的關鍵指標體系報告內容原理篇客戶關系管理理中的數量方方法方法篇數據分析方法法概論統計分析方法法數據挖掘分析析方法工具篇常用數據分析析工具簡介總結基本結論數量分析方法法(QuantitativeAnalysis)數量分析是對對事物的數量量特征、數量量關系與數量量變化的分析析。數量分析的類類型按照分析的目目的探索性數據分分析描述性數據分分析解釋性數據分分析按照問題的本本質確定性分析不確定性分析析數量分析中的的模型化方法法數量模型是對對現實問題的的描述和模仿仿模型是為認識識目的或實踐踐目的而建立立的典型的模型化化過程數據分析模型型的數據分析模模型絕對模型(CategoricalModel):依據預定定義路徑尋找找原因,如查查詢解釋模型(ExegeticalModel):依據多層層次路徑尋找找原因,如多多維分析思考模型(ContemplativeModel):參數化路路徑,如場景景分析公式模型(FormulaicModel):模型化路路徑,如數據據挖掘ReportingAdHocQueriesPredictiveModelingWhathappened?Whydidithappen?Whatwillhappen?ROI應用復雜性Stage3Stage2Stage1HumanDiscoveryMachine-assistedDiscovery常用的數據分分析方法/模型數量分析是對對事物的數量量特征、數量量關系與數量量變化的分析析。數量分析的類類型按照分析的目目的探索性數據分分析描述性數據分分析解釋性數據分分析按照問題的本本質確定性分析不確定性分析析認識分析數據據:數據測量量尺度名義尺度有序尺度間隔尺度比例尺度認識分析數據據:數據結構構類型截面數據(Cross-sectionData)時間序列數據據(Time-seriesData)面板數據(PanelData)數據分析的出出發點:數據據矩陣截面數據(Cross-sectionData)時間序列數據據(Time-seriesData)面板數據(PanelData)常用的統計分分析方法數據分類分析析聚類分析判別分析數據化簡分析析主成分分析因子分析數據相關分析析回歸分析典型相關分析析數據預測分析析時間序列預測測什么是數據挖挖掘?DataInformationKnowledgeWisdom存在太多數據據挖掘的定義義,但基本上上有這樣一種種描述結構Tofind/discover/extract/dredge/harvest、、、Interesting/novel/useful/implicit/actable/meaningful、、、Information/knowledge/patterns/trends/rules/anomalies、、、Inmassivedata/largedataset/largedatabase/datawarehouse、、、Data+contextInformation+rulesKnowledge+experience為什么會出現現數據挖掘??數據爆炸性增增長是數據挖挖掘技術應運運而生的根本本原因。只見樹木,不不見森林(Drowningindatabutstarvingforinformation)計算復雜度數據管理問題題數據類型的多多樣性處理大容量數數據是數據挖掘技術術區別于其他數據分分析方法的唯一標志志嗎?其他數數據分分析方方法::統計計學從處理理數據據的角角度看看、、、、數據規規模不不同數據來來源不不同::觀測測數據據(SecondaryAnalysis)VS試驗數數據((PrimaryAnalysis)數據類類型不不同((結構構化數數據、、半結結構化化數據據、非非結構構化數數據))從分析析思想想的角角度看看更關注注實證證性分分析((EmpiricalAnalysis)而非非探索索性分分析((ExploratoryAnalysis)更關注注模型型(Model)而非非算法法(Algorithm)但二者者具有有相當當密切切的聯聯系從數據據分析析的角角度,,統計計學現現在是是且仍仍將是是數據據挖掘掘最重重要的的技術術支撐撐和思思想源源泉更加深深入的的滲透透和交交叉((如探探索性性數據據分析析,EDA)數據挖挖掘是是數據據驅動的探探索性性分析析!數據挖挖掘::多學學科的的匯合合數據挖挖掘數據庫庫技術術統計學學其它學學科信息科科學機器學學習可視化化人工智智能科學計計算數據挖挖掘是是一個個過程程“fromdataminingtoknowledgediscoveryindatabase””.U.fayyad,G.P.ShapiroandP.Smyth(1996)數據挖挖掘過過程中中的數數據預預處理理數據清清洗填充缺缺失值值,修均噪噪聲數數據,識別或或刪除除孤立立點,并解決決數據據不一一致問問題主要分分析方方法::分箱箱(Binning)、聚聚類、、回歸歸數據集集成多個數數據庫庫、數數據方方或文文件的的集成成數據變變換規范化化與匯匯總數據簡簡化減少數數據量量的同同時,還可以以得到到相同同或相相近的的分析析結果果主要分分析方方法::抽樣樣、主主成分分分析析數據離離散化化數據簡簡化的的一部部分,但非常常重要要(尤其對對于數數值型型數據據來說說)數據挖挖掘過過程中中的數數據探探索探索性性數據據分析析(ExploratoryDataAnalysis,EDA)探索性性地查查看數數據,,概括括數據據集的的結構構和關關系對數據據集沒沒有各各種嚴嚴格假假定“玩””數據據主要任任務數據可可視化化(apictureisworthathousandwords)殘差分分析((數據據=擬擬合+殘差))數據的的重新新表達達(什什么樣樣的尺尺度--對數數抑或或平方方跟--會簡簡化分分析??)方法的的耐抗抗性((對數數據局局部不不良的的不敏敏感性性,如如中位位數耐耐抗甚甚于均均值))常見方方法統計量量,如如均值值、方方差、、根方方差、、協方方差、、峰度度、偏偏度、、相關關系數數等統計圖圖,如如餅圖圖、直直方圖圖、散散點圖圖、箱箱尾圖圖等模型,,如聚聚類數據挖挖掘結結果的的評價價興趣度度度量量:一一個模模式是是有意意義的的,如如果它它易于于被人人理解解,在在某種種程度度上,,對于于新數數據或或者測測試數數據是是有效效的、、潛在在有用用或者者驗證證了用用戶渴渴望確確認的的某些些假設設。目前仍仍無很很好的的解決決辦法法,很很大程程度上上仍依依靠人人工不存在在解決決這個個問題題的簡簡單技技術,,最終終答案案是不不要把把數據據挖掘掘當作作脫離離數據據內涵涵的簡簡單技技術來來運用用客觀興興趣度度:基基于統統計或或模式式的結結構,,如統統計量量、支支持度度、lift等主觀興興趣度度:基基于用用戶對對數據據的確確信程程度,,如意意外程程度、、新奇奇程度度或者者可行行動性性等過度擬擬合((Over-fitting)問題題什么不不是數數據挖挖掘??定量分分析((QuantitativeAnalysis)的需需要存存在企企業管管理運運行的的各個個側面面或環環節,,但并并非所所有的的定量量分析析問題題都可可以歸歸結到到數據據挖掘掘范疇疇的問問題。。簡單的的報表表、圖圖表及及多維維分析析仍是是日常常分析析工作作的主主要內內容小樣本本數據據的分分析傳傳統統統計分分析方方法更更成熟熟有效效,如如趨勢勢預測測某些特特定業業務問問題無無法用用數據據挖掘掘算法法加以以解決決,例例如資源最最優配配置問問題是是個運運籌學學問題題某些物物流管管理問問題或或者供供應鏈鏈管理理問題題是個個隨機機規劃劃問題題營銷預預演本本質是是個系系統仿仿真問問題幾個基基本概概念模型((Model)vs模式((Pattern)數據挖挖掘的的根本本目的的就是是把樣樣本數數據中中隱含含的結結構泛泛化((Generalize)到總總體((Population)上去去模型::對數數據集集的一一種全全局性性的整整體特特征的的描述述或概概括,,適用用于數數據空空間中中的所所有點點,例例如聚聚類分分析模式::對數數據集集的一一種局局部性性的有有限特特征的的描述述或概概括,,適用用于數數據空空間的的一個個子集集,例例如關關聯分分析算法((Algorithm):一一個定定義完完備((well-defined)的過過程,,它以以數據據作為為輸入入并產產生模模型或或模式式形式式的輸輸出描述型型挖掘掘(Descriptive)vs預測型型挖掘掘(Predictive)描述型型挖掘掘:對對數據據進行行概括括,以以方便便的形形式呈呈現數數據的的重要要特征征預測型型挖掘掘:根根據觀觀察到到的對對象特特征值值來預預測它它的其其他特特征值值描述型型挖掘掘可以以是目目的,,也可可以是是手段段幾類基基本的的挖掘掘算法法關聯規規則((模式式、描描述型型)發現數數據集集中的的頻繁繁模式式例如::buy(x,””diapers””)buy(x,””beers””)[0.5%,60%]分類與與預測測(模模型、、預測測型))發現能能夠區區分或或預測測目標標變量量(唯唯一的的)的的規則則或者者函數數分類的的目標標變量量一般般是范范疇型型的,,而預預測則則是數數量型型的,,并不不必然然帶有有任何何時間間延續續型的的暗示示例如::股票票市值值的預預測,,病人人病情情的判判斷聚類((模型型、描描述型型)對數據據分組組以形形成新新類,,類標標記是是未知知的例如::市場場細分分孤立點點探測測(OutlierDetection)(模模式、、預測測型))分析異異常或或噪聲聲數據據的行行為模模式例如::欺詐詐檢測測關聯規規則的的基本本概念念基本定義義給定(1)事務數數據集((2)每個事事務是數數據項的的集合,,試圖發發現項集集中的頻頻繁模式式或關聯聯關系所謂頻繁繁模式或或者關聯聯規則就就是一個個具有““AB”形式的邏邏輯蘊涵涵式頻繁模式式并不必必然蘊涵涵著因果果關系或或相關關關系!算法實現現基本上上基于APRIORI法則:頻頻繁項集集的所有有非空子子集一定定也是頻頻繁(Frequent)的基本分類類布爾關聯聯規則vs定量關聯聯規則buy(x,””diapers”)buy(x,””beers””)Age(x,””30..39”)^income(x,””42k..48k””)buy(x,””PC””)單維關聯聯規則vs多維關聯聯規則單層關聯聯規則vs多層關聯聯規則Age(x,””30..39”)^income(x,””42k..48k””)buy(x,””IBMPC”)序列模式式(SequencePattern)數據項是是一個包包含時間間標簽的的序偶[item(i),t]關聯規則則的度量量發現具有有最小置置信度和和支持度度的全部部規則X^YZ支持度(support),s,事務中包包含{X&Y&Z}的概率置信度(confidence),c,事務中包包含{X&Y}的條件下下,包含Z的條件概概率令最小支支持度為為50%,最小置信信度為50%,則有AC(50%,66.6%)CA(50%,100%)顧客購買買尿布顧客購買買兩者顧客購買買啤酒對支持度度與置信信度的批批判示例總共5000名學生,其中3000人玩籃球球3750人吃谷類類食品2000人既玩籃籃球又吃吃谷類食食品playbasketballeatcereal[40%,66.7%]是一個誤誤導規則則,因為吃谷谷類食品品的學生生占學生生總數的的75%,比66.7%更高playbasketballnoteatcereal[20%,33.3%]其實是一一個更精精確的規規則,盡管它的的支持度度和置信信度都比比較低關聯規則則的應用用市場購物物籃分析析(MarketBasketAnalysis)例如一個個事務是是客戶的的一個購購物清單單,同一一客戶的的兩份清清單被認認為是兩兩個不同同的事務務數據項是是所有可可能陳列列貨物的的全集目標是發發現同時時出現的的貨品組組合間的的關聯模模式應用:商商品貨價價設計、、倉儲規規劃、網網頁布局局、產品品目錄設設計等等等交叉銷售售(CrossSelling)客戶依次次購買不不同產品品的序列列目標是發發現在購購買某一一產品組組合之后后客戶可可能購買買的另一一產品或或服務應用:網網絡故障障分析、、網站門門戶設計計等分類問題題的基本本定義給定一數數據集合合(訓練練集)數據記錄錄由一系系列變量量組成其中有一一個變量量是目標標分類標標簽尋找一模模型,使使目標分分類變量量值是其其他變量量值的一一個函數數利用上述述函數,,一未知知分類變變量值的的數據記記錄能夠夠盡可能能準確地地被判定定到某一一類別中中去一般會有有另一獨獨立地數數據集((測試集集)用以以驗證所所構建分分類函數數的準確確性,避避免過度度擬合分類過程程示意訓練集分類學習習訓練集分類器IFrank=‘‘professor’ORyears>6THENtenured=‘‘yes’JefisYES!分類中的的決策樹樹(DecisionTree)歸納決策樹類似于流流程圖的的樹型結結構內部節點點代表對對某個屬屬性的一一次測試試分支代表表測試的的輸出結結果葉節點代代表分類類標簽或或分布決策樹的的生成包包括兩個個階段樹的創建建首先,所有訓練練樣本都都位于根根節點遞歸地基基于選擇擇屬性來來劃分樣樣本集樹的修剪剪識別并刪刪除那些些反映噪噪聲或孤孤立點的的分支應用決策策樹:對未知樣樣本進行行分類在決策樹樹上測試試樣本的的各個屬屬性值決策樹示示意age?overcaststudent?creditrating?noyesfairexcellent<=30>40nonoyesyesyes30..40示例:是是否購買買計算機機?聚類的基基本概念念基本定義義將數據對對象集劃劃分成事事先未知知的分組組或類別別聚類的原原則:類類內相似似度高,,類間相相似度低低相似度一一般為某某種距離離函數D(i,j)聚類既可可以作為為獨立分分析工具具考察數數據分布布結構,,也可以以作為其其他分析析方法的的預處理理步驟很不幸,,對聚類類結果的的評價一一般都是是主觀的的基本分類類將數據對對象集劃劃分成事事先未知知的分組組或類別別聚類示意意基于歐氏氏距離的的三維空空間中的的聚類A1A2B1xyz從算法到到應用報告內容容原理篇客戶關系系管理中中的數量量方法方法篇數據分析析方法概概論統計分析析方法數據挖掘掘分析方方法其他分析析方法工具篇常用數據據分析工工具簡介介總結基本結論論數據分析析軟件數據分析析軟件的的種類按照分析析模式統計分析析軟件數據挖掘掘軟件OLAP軟件科學計算算軟件按照分析析范圍通用分析析軟件專用分析析軟件按照分析析規模企業級分分析軟件件桌面級分分析軟件件數據分析析軟件的的基本特特點功能全面面,系統統地集成成了多種種成熟的的數據分分析方法法有完善的的數據定定義、操操作和管管理功能能方便地生生成各種種統計圖圖形和統統計表格格使用方式式簡單、、靈活,,有完備備的聯機機幫助功功能軟件開放放性好,,能方便便地和其其他軟件件進行數數據交換換學習使用用統計分分析軟件件的基本方法弄清分析析的目的的正確收集集待處理理和分析析的數據據(目的、影影響因素素的剔除除)弄清分析析方法的的概念、、含義和和適用范范圍。無無需記憶憶公式選擇一種種或幾種種分析方方法來探探索性地地分析數數據讀懂計算算機分析析的數據據結果,,發現規規律,得得出結論論SAS:ThePowertoKnowSAS(StatisticalAnalysisSystem)是一個個模塊塊化、、集成成化的的大型型應用用軟件件系統統;目目前國國際上上最流流行的的一種種大型型統計計分析析系統統;統統計分分析的的標準準軟件件SAS系統主主要完完成以以數據據為中中心的的四大大任務務:數數據訪訪問;;數據據管理理;數數據呈呈現;;數據據分析析。它由數數十個個專用用模塊塊構成成,SAS/STAT(統計計分析析);;SAS/ETS(經濟濟計量量與時時間序序列分分析));SAS/QC(質量量控制制管理理);;SAS/OR(運籌籌學));SAS/IML(矩陣陣運算算);;SAS/GRAPH(繪圖圖)等等SPSS:RealStat,RealEasySPSS((StatisticalPackagefortheSocialScience)---社社會科科學統統計軟軟件包包是世世界是是著名名的統統計分分析軟軟件之之一。。SPSSforWindows是是一個個組合合式軟軟件包包,它它集數數據整整理、、分析析功能能于一一身。。用戶戶可以以根據據實際際需要要和計計算機機的功功能選選擇模模塊,,以降降低對對系統統硬盤盤容量量的要要求,,有利利于該該軟件件的推推廣應應用。。SPSS的的基本本功能能包括括數據據管理理、統統計分分析、、圖表表分析析、輸輸出管管理等等等。。SPSS統計計分析析過程程包括括描述述性統統計、、均值值比較較、一一般線線性模模型、、相關關分析析、回回歸分分析、、對數數線性性模型型、聚聚類分分析、、數據據簡化化、生生存分分析、、時間間序列列分析析、多多重響響應等等幾大大類,,每類類中又又分好好幾個個統計計過程程,比比如回回歸分分析中中又分分線性性回歸歸分析析、曲曲線估估計、、Logistic回歸歸、Probit回回歸、、加權權估計計、兩兩階段段最小小二乘乘法、、非線線性回回歸等等多個個統計計過程程,而而且每每個過過程中中又允允許用用戶選選擇不不同的的方法法及參參數。。SPSS也有有專門門的繪繪圖系系統,,可以以根據據數據據繪制制各種種圖形形。報告內內容原理篇篇客戶關關系管管理中中的數數量方方法方法篇篇數據分分析方方法概概論統計分分析方方法數據挖挖掘分分析方方法工具篇篇常用數數據分分析工工具簡簡介總結基本結結論總結關鍵是是業務務問題題的發發現及及其構構建以以及切切實迎迎合業業務需需要從分析析方法法的角角度切切入討討論只只是手手段而而非目目的方法還還是很很重要要的方法應應該是是最不不會成成為問問題的的方法是是個工工具箱箱關于Teradata2005RevenuebyBusinessUnitTeradataDataWarehouseRetailSolutionsFinancialSolutionsWorldwideCustomerServicesSystemediaNCR公司概概貌Fortune500companyGlobaloperationsinover100countries&territoriesMorethan28,000employees$6BrevenueNon-pensionoperatingincome3pointimprovementto9%50%ofTop

GlobalRetailers60%ofTopMostAdmired

GlobalCompanies90%ofTopGlobal

TelcoFirms60%ofTop

GlobalAirlines50%oftheTop

Transportation

LogisticFirmsTeradata在Fortune500中的優異表表現LeadingindustriesBankingGovernmentInsurance&HealthcareManufacturingRetailTelecommunicationsTransportationLogisticsTravelWorldclasscustomerlistMorethan800customersGlobalpresenceOver100countriesandterritoriesFORTUNEGlobalRankings,July2005TopTenRankinginFortune500分析型CRM是擅長之一一RetailFinancialTravelCommunicationsInsuranceManufacturing/SourcingUnionBankofNorwayTechnologyROIAwardsHarrah’s-GrandPrizeWinnerStateofIowa-Winner,PublicSectorTDWIBestPracticesAwardEnterpriseDataWarehouse:UnionPacificGovernment&Non-profit:StateofMichiganWorldClassSolutionAwardsJeffersonCountyPublicSchools,winner-DataManagementcategory;GCNAgencyAwardsUSAirForceKnowledgeSystems,MaterialSystemsGroup/EnterpriseSystemsDivisionNCDMDatabaseExcellenceAwardFubonFinancialHoldingCompany(Taiwan)-SilverAwardCIOMagazineEnterpriseValueAwardsContinentalAirlines,Winner-TransportationAceHardware,Winner-Retail/WholesaleIntelligentEnterpriseEditors’ChoiceAwardsTeradatanamedoneofIntelligentEnterpriseDozenMostInfluentialCompaniesDMReview100Teradata-industryleaderinbusinessintelligence,datawarehousingandanalyticsmarketCRMMarketLeaderTeradata-MarketLeaderinCRMAnalyticscategoryBestPracticesinBusinessIntelligenceLexisNexis,ManagingandEnhancingBIApplicationsandInfrastructurecategoryRealWareAwardsFubonFinancialHoldingCompany,MeritAwardWinner-MarketingManagement,BestIntelligentCRMApplicationcategoryTeradata用戶所獲贊贊譽-2004Teradata用戶所獲贊贊譽-2005BIExcellenceAwardSponsor:GartnerGroupContinentalAirlines1to1ImpactAwardSponsor:Peppers&RogersContinentalAirlines-TechnologyOptimizationTDWIBestPracticesAwardSunrise––CustomerRelationshipManagementInnovationPrizeSponsor:01InformatiqueChampion(groupeCarrefour)Computerworld’sBestPracticesAwardinBusinessIntelligenceHospitalCorporationofAmerica,Inc.-CreatingaBIVisionandStrategiesforImprovedROI2005WorldClassSolutionAwardintheBusinessIntelligenceSponsor:DMReviewVerizonWireless––BusinessIntelligenceCRMMagazine’’s2005MarketLeadersAwardsFubonFinancialHolding-CRMElite,AnalyticsTeradata用戶所獲贊贊譽-2006TDWIBestPracticesAwardsRoyalBankofCanada-EnterpriseDataWarehousingNationwideInsurance–MasterDataManagementPannonGSM-PredictiveAnalyticsBNSFRailway,Inc.–BusinessPerformanceManagementVentanaResearch2006PerformanceLeadershipAwardsBNSFRailway,Inc.-winnerinFinancePerformanceLeadershipTheDMAAwards,FinancialServicesCouncilNationalAustraliaBankselectedaswinnerofTheDMA’sFinancialServicesCompanyoftheYearawardFinTechAsiaAwardsSponsor:FinancialInsightAsia/PacificChinaTrustCommercialBank–WinnerinCustomerAnalytics2006Supply&DemandChainExecutive100Teradatacustomerwinner,TBAJuly18,2006謝謝!!謝謝12月-2207:43:5207:4307:4312月-2212月-2207:4307:4307:43:5212月-2212月-2207:43:522022/12/317:43:529、靜夜四四無鄰,,荒居舊舊業貧。。。12月-2212月-22Saturday,December31,202210、雨中黃黃葉樹,,燈下白白頭人。。。07:43:5307:43:5307

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論