20230801303計科三班呂良datamining2_第1頁
20230801303計科三班呂良datamining2_第2頁
20230801303計科三班呂良datamining2_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——20230801303計科三班呂良datamining2其次次作業(yè)

1.Apriori算法使用子集支持性質(zhì)的先驗知識。(a)證明頻繁項集的所有非空的子集也必需是頻繁的。

答:設(shè)s是一個頻繁項集,min_sup是最小支持度閥值,任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,|D|是D有事務(wù)量,則有Support_count(s)=min_sup×|D|;

再設(shè)s’是s的非空子集,則任何包含項集s的事務(wù)將同樣包含項集s’,即:

support_count(s')supportcount(s)=min_sup×|D|.所以,s’也是一個頻繁項集。

(b)證明項集s的任意非空子集s’的支持至少和s的支持度一樣大。

答:設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,|D|是D的事務(wù)量,由定義得:

設(shè)s’是s的非空子集,由定義得:由(a)可知:support(s’)support(s)

由此證明,項集s的任意非空子集s’的支持至少和s的支持度一樣大。

(c)給定頻繁項集l和l的子集s,證明規(guī)則

的置信度不可能大于

答:設(shè)s是l的子集,則設(shè)s’是s的非空子集,則

由(b)可知:support_count(s')supportcount(s),

(l-s’))

confidence(s)

此外,confidence(s’)所以,規(guī)則

(l-s))。

的置信度不可能大于

(d)Apriori算法的一種變形將事務(wù)數(shù)據(jù)庫D中的事務(wù)劃分成n個不重疊的分區(qū)。證明

在D中頻繁的項集至少在D的一個分區(qū)中是頻繁的。答:假設(shè)頻繁項集在D的任何部分中都不頻繁。

設(shè)F為D的任何頻繁項集。令D是相關(guān)事務(wù)數(shù)據(jù)集。令C是D中事務(wù)的總數(shù)量。令A(yù)是D中包含F(xiàn)的事務(wù)數(shù)量。令min_sup是最小支持度閾值。由于F是頻繁項集,所以A=C*min_sup.令D分成n個不重疊的部分,d1,d2?dn。那么D=d1d2?dn.令c1c2?cn分別是各部分d1?dn的事務(wù)數(shù)量。則C=c1+c2+?+cn

令a1a2?an分別是各部分d1?dn中包含F(xiàn)的事務(wù)數(shù)量,則A=a1+a2+?+anA=C*min_sup即a1+a2+?+an=(c1+c2+?+cn)*min_sup①

由假設(shè)知F在各部分d1?dn中都不是頻繁的,所以ai1.所以,買hotdogs不是獨立于買humburgers。兩者存在正相關(guān)關(guān)系

c.在給定的數(shù)據(jù)上,將全置信度、最大置信度、Kulczynski和余弦的使用與提升度和相關(guān)度進行比較。

P(hotdogs|humburgers)=0.8P(humburgers|hotdogs)=0.67

全置信度:0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論