




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第5章數據挖掘算法基礎數據挖掘算法基礎1聚類目錄分類與回歸2關聯規則3智能推薦4時間序列5關聯規則分析也稱為購物籃分析,目的是從大量數據中找出各項之間的關聯關系,如關聯規則“面包=>牛奶”,其中面包稱為規則的前項,而牛奶稱為后項。常用關聯規則算法算法名稱算法描述Apriori關聯規則最常用也是最經典的挖掘頻繁項集的算法,其核心思想是通過連接產生候選項,然后通過剪枝生成頻繁項集FP-Growth針對Apriori算法的固有的多次掃面事務數據集的缺陷,提出的不產生候選頻繁項集的方法。Apriori和FP-Growth都是尋找頻繁項集的算法Eclat算法Eclat算法是一種深度優先算法,采用垂直數據表示形式,在概念和理論的基礎上利用基于前綴的等價關系將搜索空間劃分為較小的子空間灰色關聯法分析和確定各因素之間的影響程度或是若干個子因素(子序列)對主因素(母序列)的貢獻度而進行的一種分析方法支持度:項集A、B同時發生的概率稱為關聯規則的支持度。置信度:項集A發生,則項集B發生的概率為關聯規則的置信度Apriori關聯規則和頻繁項集最小支持度和最小置信度支持度最小支持度是用戶或專家定義的衡量支持度的一個閾值,表示項目集在統計意義上的最低重要性;最小置信度是用戶或專家定義的衡量置信度的一個閾值,表示關聯規則的最低可靠性。同時滿足最小支持度閾值和最小置信度閾值的規則稱作強規則。項集與頻繁項集項集是項的集合。包含k個項的項集稱為k項集,如集合{牛奶,麥片,糖}是一個3項集。項集的出現頻數是所有包含項集的事務計數,又稱作絕對支持度或支持度計數。如果項集I的相對支持度滿足預定義的最小支持度閾值,則I是頻繁項集。AprioriApriori算法的主要思想是找出存在于事務數據集中的最大的頻繁項集,再利用得到的最大頻繁項集與預先設定的最小置信度閾值生成強關聯規則。Apriori的性質頻繁項集的所有非空子集也必須是頻繁項集。根據該性質可以得出:向不是頻繁項集的項集中添加事務,新的項集一定也不是頻繁項集。AprioriApriori算法:使用候選產生頻繁項集Apriori算法實現的兩個過程:找出所有的頻繁項集
由頻繁項集產生強關聯規則Apriori客戶ID轉換后的商品ID101a,c,e102b,d103b,c104a,b,c,d105a,b106b
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 九江學院《高等數學理論教學》2023-2024學年第一學期期末試卷
- 江蘇財會職業學院《彈性力學與有限元》2023-2024學年第二學期期末試卷
- 天津鐵道職業技術學院《PHP動態網站開發》2023-2024學年第二學期期末試卷
- 深圳技術大學《透過影像看健康》2023-2024學年第一學期期末試卷
- 天津美術學院《鄉村幼兒園教師專業素養案例原理方法》2023-2024學年第二學期期末試卷
- 漯河食品職業學院《住宅及辦公空間室內環境設計》2023-2024學年第一學期期末試卷
- 石家莊城市經濟職業學院《漢語國際教育概論》2023-2024學年第二學期期末試卷
- 楊凌職業技術學院《食品工程原理(2)》2023-2024學年第二學期期末試卷
- 離婚協議書模板子女已成年
- 回遷房屋買賣合同集錦二零二五年
- 2024-2025學年廣東省高三上學期期末四校聯考英語試題(解析版)
- 淄博2024年山東淄博市技師學院高層次人才招聘(第二批)筆試歷年典型考點(頻考版試卷)附帶答案詳解
- 工地試驗室管理經驗交流
- 高教社馬工程倫理學(第二版)教學課件11
- 2025年全國普通話水平測試50套復習題庫及答案
- 破釜沉舟成語故事課件全
- 能源行業碳排放監測與減排系統設計方案
- 《實驗室生物安全》課件
- 攝影師經紀人合作合同
- 手術室手衛生PDCA
- DB31∕T 1038-2017 生態公益林主要造林樹種苗木質量分級
評論
0/150
提交評論