




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 高端車潛在用戶的發現 基于線下線上數據的研究PPT模板下載: 行業PPT模板: 節日PPT模板: PPT素材下載: PPT圖表下載: 優秀PPT下載: PPT教程: Word教程: Excel教程: 資料下載: PPT課件下載: 范文下載: 試卷下載: 教案下載: 目錄概述01理論基礎02線下數據的研究0304線上數據的研究目錄概述01理論基礎02線下數據的研究0304線上數據的研究概述全文思路目錄概述01理論基礎02線下數據的研究0304線上數據的研究理論基礎數據挖掘理論基礎邏輯回歸分析 邏輯回歸用于估計某事物的可能性。 邏輯回歸模型是一個定性響應變量(因變量Y)的預測模型。 邏輯模型中的
2、定性響應變量其實又是一個二值變量(binary)。 = (/ )=+ +理論基礎決策樹理論基礎關聯規則 支持度和信任度是兩個最基本和最重要的衡量規則強弱的指標。X-Y的支持度:指的是集合T中包含XY事件的百分比,即P(XY)的估計。 如果支持度很小,那么就可以說該規則的發生并沒有必然性。 X-Y的置信度:指X和Y同時發生的事件數量占所有X事件發生數量的百分比。即P(Y|X)的估計。 置信度決定了關聯規則的可預測度。如果一條關聯規則的置信度很低,那么從X就很難可靠地推出Y。目錄概述01理論基礎02線下數據的研究0304線上數據的研究線下數據的研究基于邏輯回歸模型的研究返回返回理論假設 用戶購買高
3、端車行為的影響因素: 購車方式 用戶的性別 預期保險費用 預期裝設費用 已有車品牌 收入情況線下數據的研究基于邏輯回歸模型的研究理論假設 對影響用戶購買高端車行為的因素提出的假設: H1:若用戶曾經使用全款方式來購車,那么其購買高端車的概率會低; H2:男性用戶相比于女性用戶,其購買高端車的概率會高;H3:用戶的預期保險費用越高,那么其購買高端車的概率越大;H4:用戶的預期裝設費用越高,那么其購買高端車的概率越大; H5:若用戶已擁有寶馬品牌的車,那么相比于沒有車或沒有寶馬車的用戶,其購買高端車的概率會高。 H6:若用戶的收入越高,那么其購買高端車的概率會越高。 線下數據的研究基于邏輯回歸模型
4、的研究數據準備1.數據來源“來自國內某汽車經銷商后臺的ERP系統,總數據量超過50萬條線下數據的研究基于邏輯回歸模型的研究數據準備2.數據預處理根據客戶id、訂單id、產品id等主鍵將上述5張表連接成一張總表(“寬表”)缺失值處理3.定義高端車用戶本文將選擇汽車的價格作為高端車的定義標準,高于60萬元的汽車將被標注為高端車。(在“寬表”后面添加因變量字段“是否購買高端車”,取值為“是”和“否”)線下數據的研究基于邏輯回歸模型的研究數據準備4.變量設置因變量Y為 “是否購買高端車”(對字符型變量進行啞變量的變換): “1”-“是”;“0”-“否” 。自變量X是“寬表”中的任意字段,比如客戶性別、
5、年齡、購買意向、訂單詳情等。線下數據的研究基于邏輯回歸模型的研究模型的構建與實證1.公式解釋線下數據的研究基于邏輯回歸模型的研究模型的構建與實證1.公式解釋找出那些較大的影響因素以及其系數。通過反函數將得出用戶購買高端車的概率P:線下數據的研究基于邏輯回歸模型的研究模型的構建與實證2.模型結果逐步回歸:每次都選擇對因變量影響最顯著的自變量進入模型,同時對所有已經被選擇進入模型的變量進行逐一檢查,將不顯著的自變量剔除。線下數據的研究基于邏輯回歸模型的研究模型的構建與實證2.模型結果-2.8818線下數據的研究基于邏輯回歸模型的研究3.結果討論C1:用戶如果使用全款方式購車,那么其購買高端車的概率
6、將較小,如果使用分期付款方式購車,那么其購買高端車的概率會比較大。這個結論驗證了假設H1。 C2:用戶如果為男性,那么其購買高端車的概率會高一點。這個結論驗證了假設H2。C3:用戶預期保險費用越高,其購買高端車的概率越大。這個結論驗證了假設H3。C4:用戶預期裝設費用越高,其購買高端車的概率越大。這個結論驗證了假設H4。C5:用戶如果已經擁有寶馬系列的車,那么其再次購車會選擇高端車的概率會較大。這個結論驗證了假設H5。C6:用戶收入水平最終沒有被選入模型,所以無法驗證假設H6。線下數據的研究基于決策樹模型的研究數據準備1.數據來源:在Logistic回歸模型中使用的數據是同一組數據2.數據預處
7、理(與Logistic回歸模型中基本相同)第一,決策樹模型不需要對字符型變量進行啞變量的變換。第二,決策樹模型不需要對缺失值進行填充、刪除等操作。線下數據的研究基于決策樹模型的研究模型的構建與實證1.決策樹停止生長問題的確定(兩種方法)“錯誤率”指標法:即選擇最低驗證集錯誤率的時候,同時葉子節點最少時的葉子數量作為最終模型的葉子節點數量。同時參考了25%滲透率下的響應率。選擇7個葉子作為決策樹葉子節點數!線下數據的研究基于決策樹模型的研究模型的構建與實證2.模型結果線下數據的研究基于決策樹模型的研究規則解釋與分析1.規則解釋規則一:規則二:線下數據的研究基于決策樹模型的研究1.規則解釋規則三:
8、規則四:線下數據的研究基于決策樹模型的研究規則分析1.引入負面規則來剔除低概率用戶。R1: 當保險金額在3200與12000之間,且裝飾金額小于5000,且保修金額小于48000的時候,該用戶購買高端車的概率極低只有2%。 R2: 當用戶使用貸款方式購車、且保險金額高于12000,且裝飾金額小于5000,且保修金額小于48000的時候,該用戶購買高端車的概率同樣極低只有5%。線下數據的研究基于決策樹模型的研究規則分析2.引入正面規則來選擇高概率用戶。R3:當保修金額大于48000,那么用戶有93%的概率購買高端車。R4:當裝飾金額大于38000,且保修金額小于48000,那么該用戶可能購買高端
9、車的概率是80%。線下數據的研究邏輯回歸模型與決策樹模型的比較結果對比Logistic模型的結果選入了5個變量進入模型,按照他們對因變量影響程度從大到小排列如下:付款方式(是否全款)、性別(是否男性)、預期保險費用、預期裝設費用、已有車品牌(是否已有寶馬車)。決策樹模型最終進入模型的變量有4個:保修金額、裝設金額、保險金額、金融貸款還款期限,這4個自變量與Logistic模型中的5個自變量完全不同。 兩個模型的結果不一樣的根本原因是兩個模型的原理不一樣。線下數據的研究邏輯回歸模型與決策樹模型的比較響應率對比兩個模型由于建模原理不同,對自變量的選擇也不同,但是模型效果卻相似。目錄概述01理論基礎
10、02線下數據的研究0304線上數據的研究線上數據的研究數據可視化研究數據準備1.數據來源 本文用以實證的線上數據均來自于汽車之家論壇。 28,708位用戶 42,603的條對應關系 用爬蟲程序獲得的數據經過整理形成三張表線上數據的研究數據可視化研究數據準備2.數據預處理 根據用戶ID、車輛ID等主鍵將上述表連接成一張綜合表。 綜合表的記錄中不含缺失值,因此不需要考慮缺失值的處理。線上數據的研究數據可視化研究數據的初步分析與可視化1.以品牌為粒度的分析與可視化線上數據的研究數據可視化研究數據的初步分析與可視化1.以品牌為粒度的分析與可視化這8類關注率遠高于當前車輛擁有率的車品牌中,大部分是高端車
11、品牌。 線上數據的研究數據可視化研究數據的初步分析與可視化2.以原產地為粒度的分析與可視化 無論是從目前的市場占有還是未來的發展潛力來看,中、德、日三國產的汽車在中國都是遙遙領先,德國車的未來發展勢頭強勁,有望取代國產車成為國內市場的龍頭。 線上數據的研究基于汽車不同屬性的關聯規則分析描述性統計量1.數據來源:與可視化分析所用的數據一致(包含四個字段:擁有車原產地、關注車原產地、擁有車品牌、關注車品牌)。2.數據預處理:刪除同一粒度下同一種類之間的數據(此類數據關聯度很高,無研究意義)例如:關注寶馬車與擁有寶馬的關聯度采集到的數據不含缺失值,因此不需要考慮缺失值的處理。線上數據的研究基于汽車不
12、同屬性的關聯規則分析描述性統計量3.最終獲得的描述性統計量線上數據的研究基于汽車不同屬性的關聯規則分析對品牌屬性進行關聯規則發現(最小支持度為0.02,置信度為0.1, 提升為1,數據量為100,)1. 擁有品牌關注品牌大眾汽車在國內廣受歡迎,許多其他品牌的車主都有購買大眾汽車的可能性。而大眾車主則關注著奧迪、寶馬。 線上數據的研究基于汽車不同屬性的關聯規則分析對品牌屬性進行關聯規則發現(最小支持度為0.001,置信度為0.1, 數據量為100)2. 關注品牌擁有品牌大眾車主對各種車都感興趣,并且更關注斯柯達、奧迪、奔馳、寶馬等品牌。另外豐田車主更關注雷克薩斯,寶馬車主關注保時捷。 線上數據的
13、研究基于汽車不同屬性的關聯規則分析對原產地屬性進行關聯則發現(最小支持度為0.02,置信度為0.1, 提升為1,數據量為100)1. 擁有產地關注產地德國車受到各種車主的普遍關注。除此之外,國產車車主對日本車有很高的關注度,日本車的潛在客戶是國產車車主和德國車車主。 線上數據的研究基于線上數據研究的結果討論基于品牌屬性的結果A1:由已有車的品牌推導出關注車的品牌的規則; 應用A1規則,我們可以根據用戶已擁有車的品牌來預測其關注某品牌高端車可能性,并判斷其是否是該品牌高端車的潛在用戶。A2:由關注車的品牌推導出已有車的品牌的規則; 應用A2規則,同樣可以幫助汽車銷售商進行高端用戶發現。線上數據的研究基于線上數據研究的結果討論A1規則的利用模型顯示:大眾車的品牌在最國內最受歡迎,大都數品牌的車主都關注著大眾車,尤其是斯柯達的車主。啟示:大眾品牌的高端車的潛在高端用戶分布于各個品牌的車主,尤其是斯柯達的車主購買大眾品牌的高端車的可能性更大。A2規則的利用模型顯示:多品牌車的粉絲中都有大眾車主,尤其是斯柯達車和奧迪車更受大眾車主的喜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋室內裝修合同
- 房產中介服務合同
- 企業安全管理制度咨詢服務合同
- 商場商鋪房屋租賃合同
- 全新供貨水果合同
- 原材料運輸供貨合同
- 法律常識合同法考點解析
- 殯儀服務合同條款
- 飯店勞務合同年
- 建筑工程招投標與合同管理復習
- 【湛江】2025年中國熱帶農業科學院農產品加工研究所第一批招聘工作人員30人(第1號)筆試歷年典型考題及考點剖析附帶答案詳解
- 外研版(2025新版)七年級下冊英語期中復習:Unit 1~3+期中共4套學情調研測試卷(含答案)
- 成人重癥患者人工氣道濕化護理專家共識 解讀
- 商業票據與核算
- (完整版)PHQ-9抑郁癥篩查量表
- 山中問答教學設計
- 基于高中思想政治學科核心素養的教學研究與實踐PPT課件
- 礦山及其他工程破損山體植被恢復技術(DOC25頁)
- 鋁合金門窗、百葉施工組織設計
- 畢業設計(論文)-網球自動撿球機設計
- 上海應用技術大學2019屆畢業生就業推薦表
評論
0/150
提交評論