數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)_第1頁(yè)
數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)_第2頁(yè)
數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)_第3頁(yè)
數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)_第4頁(yè)
數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘與教師評(píng)價(jià)系統(tǒng)摘要今年來(lái),隨著網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的迅速發(fā)展,人們所積累的數(shù)據(jù)越來(lái)越多,這些數(shù)據(jù)的背后隱藏著許多有用的信息和知識(shí),這些信息和知識(shí)得到了廣泛的引用,比如金融投資、政府決策、生產(chǎn)控制、市場(chǎng)分析、醫(yī)療保險(xiǎn)和科學(xué)研究等領(lǐng)域。如今的社會(huì),競(jìng)爭(zhēng)很激烈,擁有獲取隱藏在數(shù)據(jù)背后的有用知識(shí),并利用它們的能力變得越來(lái)越重要。在教育領(lǐng)域也是一樣,各大高校在每學(xué)年的教學(xué)評(píng)價(jià)過(guò)程中,面臨著同樣的問(wèn)題。教學(xué)教務(wù)管理部門面對(duì)大量的教學(xué)評(píng)價(jià)數(shù)據(jù),實(shí)用傳統(tǒng)的評(píng)價(jià)方法,效果不大,已經(jīng)滿足不了現(xiàn)代教學(xué)發(fā)展的需要。人們希望能夠?qū)@些教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行多角度、高層次的分析和處理,希望從中能發(fā)現(xiàn)更多、更有用的知識(shí)和信息,為提高教學(xué)質(zhì)量提供更多的方法和措施。教師教學(xué)評(píng)估的現(xiàn)狀育活動(dòng)是一個(gè)長(zhǎng)期復(fù)雜的過(guò)程,工作中的任何成績(jī)都是日積月累的結(jié)晶,絕非一朝一夕的產(chǎn)物,僅僅依靠一、兩次的單項(xiàng)評(píng)價(jià),不可能真實(shí)反映教師工作的整個(gè)發(fā)展過(guò)程,也必然導(dǎo)致評(píng)價(jià)結(jié)論與教師實(shí)際工作表現(xiàn)的偏差。缺少綜合評(píng)價(jià),就無(wú)法全面了解評(píng)價(jià)對(duì)象的工作表現(xiàn),無(wú)法把握教師的發(fā)展傾向和發(fā)展需求,也無(wú)法修正評(píng)價(jià)過(guò)程中的暈輪效應(yīng)、趨同效應(yīng)等引起的各種偏差。因此,新課程必須強(qiáng)調(diào)對(duì)教師進(jìn)行綜合評(píng)價(jià)。同時(shí),新課程觀下的教師評(píng)價(jià)也注重教師的個(gè)體差異。由于教師在個(gè)性心理、職業(yè)素養(yǎng)、教學(xué)風(fēng)格、交往類型和工作背景等方面都存在較大差異,因此,評(píng)價(jià)應(yīng)根據(jù)這種差異,確立個(gè)性化的評(píng)價(jià)標(biāo)準(zhǔn)、評(píng)價(jià)重點(diǎn)以及選擇相應(yīng)的評(píng)價(jià)方法,有針對(duì)性地對(duì)每位教師提出改進(jìn)建議、專業(yè)發(fā)展目標(biāo)和進(jìn)修計(jì)劃等。只有這樣,才能充分挖掘教師的潛能,發(fā)揮教師的特長(zhǎng),更好地促進(jìn)教師的專業(yè)發(fā)展和對(duì)于教師的評(píng)價(jià)考核是學(xué)校教學(xué)質(zhì)量的提升,調(diào)整教學(xué)體制,教師等級(jí)評(píng)定的重要參考依光,對(duì)教師工作的各個(gè)環(huán)節(jié)進(jìn)行系統(tǒng)的、全程的、較長(zhǎng)時(shí)間的、循環(huán)往復(fù)的評(píng)價(jià)。教師從事的教育活動(dòng)是一個(gè)長(zhǎng)期復(fù)雜的過(guò)程,工作中的任何成績(jī)都是日積月累的結(jié)晶,絕非一朝一夕的產(chǎn)物,僅僅依靠一、兩次的單項(xiàng)評(píng)價(jià),不可能真實(shí)反映教師工作的整個(gè)發(fā)展過(guò)程,也必然導(dǎo)致評(píng)價(jià)結(jié)論與教師實(shí)際工作表現(xiàn)的偏差。缺少綜合評(píng)價(jià),就無(wú)法全面了解評(píng)價(jià)對(duì)象的工作表現(xiàn),無(wú)法把握教師的發(fā)展傾向和發(fā)展需求,也無(wú)法修正評(píng)價(jià)過(guò)程中的暈輪效應(yīng)、趨同效應(yīng)等引起的各種偏差。因此,新課程必須強(qiáng)調(diào)對(duì)教師進(jìn)行綜合評(píng)價(jià)。同時(shí),新課程觀下的教師評(píng)價(jià)也注重教師的個(gè)體差異。由于教師在個(gè)性心理、職業(yè)素養(yǎng)、教學(xué)風(fēng)格、交往類型和工作背景等方面都存在較大差異,因此,評(píng)價(jià)應(yīng)根據(jù)這種差異,確立個(gè)性化的評(píng)價(jià)標(biāo)準(zhǔn)、評(píng)價(jià)重點(diǎn)以及選擇相應(yīng)的評(píng)價(jià)方法,有針對(duì)性地對(duì)每位教師提出改進(jìn)建議、專業(yè)發(fā)展目標(biāo)和進(jìn)修計(jì)劃等。只有這樣,才能充分挖掘教師的潛能,發(fā)揮教師的特長(zhǎng),更好地促進(jìn)教師的專業(yè)發(fā)不僅繁瑣,效率低,而且只對(duì)提交的評(píng)測(cè)數(shù)據(jù)做簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì)處理,無(wú)法準(zhǔn)確客觀地從這些數(shù)據(jù)中得到更多更有價(jià)值的信息。教師評(píng)價(jià)系統(tǒng)普遍存在自動(dòng)化程度低,數(shù)據(jù)處理不科學(xué)等現(xiàn)象,因此可以利用數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)、聯(lián)機(jī)分析處理技術(shù)、數(shù)據(jù)挖掘技術(shù)對(duì)評(píng)測(cè)的數(shù)據(jù)進(jìn)行采樣處理。根據(jù)數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建的流程和聯(lián)機(jī)分析處理的過(guò)程,利用瀏覽器/服務(wù)器的模式,構(gòu)建了系統(tǒng)的開發(fā)架構(gòu)圖,以數(shù)據(jù)倉(cāng)庫(kù)中中心,通過(guò)對(duì)教務(wù)管理數(shù)據(jù)庫(kù)、學(xué)生管理系統(tǒng)數(shù)據(jù)庫(kù)、教師管理系統(tǒng)數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)的抽取,構(gòu)建面向主題的數(shù)據(jù)倉(cāng)庫(kù),再對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行OLAP分析和數(shù)據(jù)挖掘處理,得到教師的綜合評(píng)價(jià)得分,并評(píng)出等級(jí),建立教師質(zhì)量評(píng)價(jià)指標(biāo)體系,實(shí)現(xiàn)對(duì)教師教學(xué)評(píng)價(jià)的自動(dòng)化、智能化。數(shù)據(jù)挖掘簡(jiǎn)介語(yǔ):Knowledge-DiscoveryinDatabases,簡(jiǎn)稱:KDD)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指通過(guò)統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過(guò)去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)上述目標(biāo)。數(shù)據(jù)挖掘的發(fā)展算機(jī)通過(guò)算法自動(dòng)獲取知識(shí)。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域中的重要研究方向。Rosenblate的感知機(jī),它是最早用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識(shí)別的方法;Sammel的西洋跳棋程序,他用線性表達(dá)式的啟發(fā)了勝過(guò)作者和洲際冠軍的成績(jī)。20世紀(jì)80年代,機(jī)器學(xué)習(xí)取得了較大的成果。Michelski等人的AQ1系統(tǒng)(1980),能從大量病例中歸納出大豆病癥的判斷規(guī)則。AQ11是一個(gè)很成功的歸納學(xué)習(xí)方法;Quiulan的ID3(1983)決策樹方法影響很大,實(shí)用性很強(qiáng);Langley等人的BACON系統(tǒng)(1987)能重新發(fā)現(xiàn)物理學(xué)的大量規(guī)律;Rumelhart等人研制的反向傳播神經(jīng)網(wǎng)絡(luò)BP模型(1985)為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)開創(chuàng)了一個(gè)新階段。開了第一屆國(guó)際機(jī)器學(xué)習(xí)學(xué)會(huì)研討會(huì);1984年《機(jī)器學(xué)習(xí)》雜志問(wèn)世。器學(xué)習(xí)學(xué)會(huì)。我國(guó)學(xué)者洪家榮研制的AEI系統(tǒng)(1985)采用了擴(kuò)張矩陣方法;鐘鳴和陳文偉研制的IBLE方法(1992)利用信道容量建立決策規(guī)則樹,識(shí)別效果比ID3更高。1989年在美國(guó)召開了第一屆知識(shí)發(fā)現(xiàn)(KDD)國(guó)際學(xué)術(shù)會(huì)議,從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí) (KnowledgeDiscoveryinDatabase,KDD)形成了新概念。KDD研究的問(wèn)題有:1定型知識(shí)1995年在加拿大召開了第一屆知識(shí)發(fā)現(xiàn)(KDD)和數(shù)據(jù)挖掘(DM)國(guó)際學(xué)術(shù)會(huì)議。由于把數(shù)據(jù)庫(kù)的“數(shù)據(jù)”形象地比喻成礦床,因此“數(shù)據(jù)挖掘(DataMining,DM)一詞很快就流庫(kù)中關(guān)聯(lián)規(guī)則的挖掘,利用粗糙集進(jìn)行屬性約簡(jiǎn)和規(guī)則獲取等。據(jù)挖掘的技術(shù)和方法用于數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)挖掘的含義掘可一總結(jié)出這么一條規(guī)則:(頭發(fā)=黑色)V(眼睛=黑色)(亞洲人)。這個(gè)規(guī)則表示如果一個(gè)人的頭發(fā)是黑色并且眼睛也是黑色,那么他(她)就是亞洲人。學(xué)習(xí)中研究的方法。數(shù)據(jù)挖掘中采用機(jī)器學(xué)習(xí)的方法有歸納學(xué)習(xí)方法(覆蓋正例排斥反例方法,如AQ系列算法、決策樹方法、關(guān)聯(lián)規(guī)則挖掘等)、遺傳算法、發(fā)現(xiàn)學(xué)習(xí)算法(如公式發(fā)現(xiàn)系統(tǒng)BACON)等。數(shù)據(jù)挖掘的應(yīng)用目前數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛運(yùn)用在金融行業(yè)企業(yè)中,利用它可以成功預(yù)測(cè)銀行客戶通客戶的方法。各銀行在自己的ATM機(jī)上就捆綁了顧客可能感興趣的本行產(chǎn)品信息,供使用本行ATM機(jī)的用戶了解。如果數(shù)據(jù)庫(kù)中顯示,某個(gè)高信用限額的客戶更換了地址,這個(gè)信客戶的特點(diǎn),同時(shí)也可以顯示出顧客會(huì)對(duì)什么產(chǎn)品感興趣。同時(shí),一些知名的電子商務(wù)站點(diǎn)也從強(qiáng)大的關(guān)聯(lián)規(guī)則挖掘中的受益。這些電子購(gòu)物網(wǎng)站使用它們?cè)O(shè)置相應(yīng)的交叉銷售,也就是購(gòu)買某種商品的顧客會(huì)看到相關(guān)的另外一種商品的廣告。如果你經(jīng)常百度一些關(guān)鍵詞,下次瀏覽時(shí),你可能就會(huì)看到一些相關(guān)的廣告和鏈接。如果你經(jīng)常瀏覽某購(gòu)物網(wǎng)站,則它會(huì)根據(jù)你的某些消費(fèi)習(xí)慣向你推薦某些產(chǎn)品。成功例子數(shù)據(jù)挖掘中的一個(gè)最著名的例子應(yīng)該就是啤酒與尿布的故事。TB,里面存放了各個(gè)門店的詳細(xì)交易信息。如何從信息的海洋中發(fā)現(xiàn)營(yíng)銷機(jī)會(huì),找到有利需要更高級(jí)的分析技術(shù)來(lái)協(xié)助從海量數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律。為了能夠準(zhǔn)確了解顧客的購(gòu)買這種高級(jí)的分析技術(shù)之一就是數(shù)據(jù)挖掘,而數(shù)據(jù)挖掘領(lǐng)域里最典型的案例就是“啤酒與世界零售連鎖企業(yè)巨頭沃爾瑪擁有世界上最大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)之一,里面存放了各個(gè)門店的籃分析,想知道顧客經(jīng)常一起購(gòu)買的商品有哪些,結(jié)果他們有了意外的發(fā)現(xiàn):“跟尿布一起購(gòu)買最多的商品竟是啤酒!”于是,沃爾瑪派出市場(chǎng)調(diào)查人員和分析師對(duì)這一挖掘結(jié)果進(jìn)行調(diào)查分析。經(jīng)過(guò)大量實(shí)際調(diào)查和分析,揭示了一個(gè)隱藏在“尿布與啤酒”背后的美國(guó)人的一種行為模式:一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的后為小孩買尿布,而丈夫們?cè)谫I尿布后又隨手帶回了他們喜歡的啤酒。掘分析,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)內(nèi)在這一有價(jià)值的規(guī)律的。這是數(shù)據(jù)挖掘技術(shù)對(duì)歷史數(shù)據(jù)進(jìn)行分析的結(jié)果,它符合現(xiàn)實(shí)情況嗎?是否是一個(gè)有用的知和分析,揭示了一個(gè)隱藏在“尿布與啤酒”背后的美國(guó)人的一種行為模式:一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。在買尿布后又隨手帶回了他們喜歡的啤酒。是尿布與啤酒的銷售量雙雙增長(zhǎng)。分析,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)內(nèi)在這一有價(jià)值的規(guī)律的。系統(tǒng)用到的數(shù)據(jù)挖掘方法集合論原理是數(shù)據(jù)挖掘中的一個(gè)非常重要的理論基礎(chǔ),常用于分類、聚類問(wèn)題和關(guān)聯(lián)規(guī)和決策(類別)屬性中的等價(jià)類(一個(gè)或多個(gè)屬性取值均相同的元組)之間的覆蓋關(guān)系;AQ11方法是對(duì)覆蓋正例排斥反例的種子(多個(gè)屬性取值的與關(guān)系),構(gòu)成規(guī)則知識(shí)。集合論原理用于解決聚類問(wèn)題時(shí),主要是按數(shù)據(jù)集中元素間的距離遠(yuǎn)近或相似度大小,成多個(gè)類別集合。集合論原理用于關(guān)聯(lián)規(guī)則挖掘時(shí)是計(jì)算數(shù)據(jù)項(xiàng)(如商品)集在整個(gè)集合中和相關(guān)集合中所占的比例,大于閥值(支持度和可信度)時(shí)構(gòu)成數(shù)據(jù)項(xiàng)之間關(guān)聯(lián)規(guī)則。1.粗糙集方法可分辨關(guān)系)為基礎(chǔ),用于分類問(wèn)題。它是上、下近似兩個(gè)集合來(lái)逼近任意一個(gè)集合,該集合的邊界線區(qū)域被定義為上近似集和近似集之差集。上、下近似集可以通過(guò)等價(jià)關(guān)系給出確定的描述,邊界域的含糊元素?cái)?shù)目可以被計(jì)算出來(lái)。而模糊集(Fuzzy)是用隸屬度來(lái)描述集合邊界的不確定性,隸屬度是認(rèn)為給定的,不是計(jì)算出來(lái)的。粗糙集合理論用在數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)主要體現(xiàn)在:1.利用等價(jià)關(guān)系對(duì)數(shù)據(jù)庫(kù)進(jìn)行屬性。聚類方法1.聚類方法分類∈D,使得不同類中的數(shù)據(jù)盡可能的不相似(或距離較遠(yuǎn)),而同一類中的數(shù)據(jù)盡可能的相似(或距離較近)。如果K=1或k=|D|(|D|表示集合D的元素個(gè)數(shù)),則成為平凡聚類。按照聚類結(jié)果來(lái)劃分聚類算法,分為三種:(1)覆蓋(Coverage):如果每個(gè)對(duì)象至少屬于一個(gè)聚類,則成聚類為覆蓋的否則為非覆(2)相交(Separation):如果至少一個(gè)對(duì)象屬于一個(gè)以上的聚類,則成聚類為模糊的,反之,如果任意兩個(gè)聚類的交集為空,則稱聚類是確定的;(3)結(jié)構(gòu)(Structure):如果兩個(gè)聚類或者不想交或者其中是另一個(gè)的子集,則成聚類為層次的,否則為非層次的。按聚類的原理和方法來(lái)劃分聚類算法,也分為三種:(1)層次聚類(2)層次聚類(HierarchicalClustering)方法遞歸地對(duì)對(duì)象進(jìn)行合并或者分裂,知道滿足某一終止條件。層次聚類的結(jié)果可以用二叉樹表示,書中的每個(gè)節(jié)點(diǎn)都是一個(gè)聚類,下層的聚類是上層聚類的嵌套,每一層借點(diǎn)構(gòu)成一組劃分。根據(jù)二叉樹生成的順序,可以把層次聚類方法分為合并型層次聚類和分解型層次聚合并型層次聚類從單成員聚類開始,把它們逐漸合并成更大的聚類,在每一層中,相聚最近的兩個(gè)聚類被合并。相反,分解型層次聚類從包含所有對(duì)象的一個(gè)聚類開始,把它逐漸分解成更小的聚類。2.劃分聚類分下達(dá)到最優(yōu)。劃分算法把聚類問(wèn)題轉(zhuǎn)化成一個(gè)組合優(yōu)化問(wèn)題,從一個(gè)初始劃分或者一個(gè)初始聚點(diǎn)集合開始,利用迭代控制策略優(yōu)化目標(biāo)函數(shù)。中心最近的一個(gè)對(duì)象(k-medoids算法)。K-means(K-均值)算法是最流行的聚類算法之一。它首先隨機(jī)地選取k個(gè)初始聚類中心,并把每個(gè)對(duì)象分配給里它最近的中心,從而得到一個(gè)初始聚類。然后,計(jì)算出當(dāng)前每個(gè)聚類最近的中心。如果新的聚類的質(zhì)量?jī)?yōu)于原先的聚類,則用新聚類代替原聚類。循環(huán)執(zhí)行這一過(guò)程直至聚類質(zhì)量不再提高為止。后來(lái),許多變形算法都是在基本k-means算法的基礎(chǔ)上做了改進(jìn)。3.基于密度的聚類以空間中的一點(diǎn)為中心,單位體積內(nèi)點(diǎn)的個(gè)數(shù)成為該點(diǎn)的密度,從直觀來(lái)看,聚類的內(nèi)部點(diǎn)點(diǎn)的密度較大,而聚類之間點(diǎn)的密度嬌小。基于密度的聚類(Density-basedClustering)根據(jù)空間密度的差別,把具有相似密度的點(diǎn)作為聚類。由于密度是一個(gè)局部概念,因此這類算法又稱為局部聚類(LocalClustering)。基于密度的聚類通常只掃描一次數(shù)據(jù)庫(kù),所以成為單次掃描聚類(SingleScanClustering)。對(duì)于空間中的一個(gè)對(duì)象,如果它在給定半徑Eps的領(lǐng)域中的對(duì)象個(gè)數(shù)大于某個(gè)給定數(shù)值Minpts,則該對(duì)象被成為核心對(duì)象(corepoint),否則稱為邊界對(duì)象。由一個(gè)核心對(duì)象密度可大的所有對(duì)象構(gòu)成一個(gè)聚類。層次聚類和劃分聚類是最常用的方法。關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則(AssociationRule)挖掘是發(fā)現(xiàn)大量數(shù)據(jù)庫(kù)中項(xiàng)集之間的關(guān)聯(lián)關(guān)系。隨著大量數(shù)據(jù)的增加和存儲(chǔ),許多人士對(duì)于從數(shù)據(jù)庫(kù)中挖掘關(guān)聯(lián)規(guī)則越來(lái)越感興趣。從大量商業(yè)事務(wù)中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助許多商業(yè)決策的制定,如分類設(shè)計(jì)、交叉購(gòu)物等。目前,關(guān)聯(lián)規(guī)則挖掘已成為數(shù)據(jù)挖掘領(lǐng)域中要的研究方向。關(guān)聯(lián)規(guī)則模式屬于描述型模式,發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法屬于無(wú)監(jiān)督學(xué)習(xí)的方法。Agrawal等于1993年首先提出了挖掘顧客交易數(shù)據(jù)庫(kù)中項(xiàng)集見的關(guān)聯(lián)規(guī)則問(wèn)題,以后諸多研究人員對(duì)關(guān)聯(lián)規(guī)則的挖掘問(wèn)題進(jìn)行了大量的研究。他們的工作包括對(duì)原有的算法進(jìn)行優(yōu)化,如引入隨機(jī)采樣、并行的思想等,以提高算法挖掘規(guī)則的效率;對(duì)關(guān)聯(lián)規(guī)則的應(yīng)用進(jìn)行最近也有獨(dú)立于Agrawal的頻繁集方法的工作,以克服頻繁集方法的一些缺陷,探索挖掘關(guān)聯(lián)規(guī)則的新方法。同時(shí)隨著OLAP技術(shù)的成熟和應(yīng)用,將OLAP和關(guān)聯(lián)規(guī)則結(jié)合也成了一個(gè)重要的方向。也有一些工作注重與對(duì)挖掘到的模式的價(jià)值進(jìn)行評(píng)估,他們提出的模型建議了一些值得考慮的研究方向。關(guān)聯(lián)規(guī)則的挖掘原理關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)交易數(shù)據(jù)苦衷不同商品(項(xiàng))之間的關(guān)系,這些規(guī)則找出顧客購(gòu)買行為,如購(gòu)買了某一商品對(duì)購(gòu)買其他商品的影響。發(fā)現(xiàn)這樣的規(guī)則可以應(yīng)用于商品貨架設(shè)計(jì)、貨存安排以及根據(jù)購(gòu)買模式對(duì)用戶進(jìn)行分類。現(xiàn)實(shí)中,這樣的例子很多。罪定性的例子是超級(jí)市場(chǎng)利用最前端收款機(jī)手機(jī)存儲(chǔ)了大量的售貨數(shù)據(jù),這些數(shù)據(jù)是一條條的購(gòu)買事務(wù)記錄,每條記錄存儲(chǔ)了事務(wù)處理時(shí)間,顧客購(gòu)買的物品的數(shù)量以及金額等。這些數(shù)據(jù)中長(zhǎng)隱含形式如下的在購(gòu)買鐵錘的顧客當(dāng)中,有70%的人同時(shí)購(gòu)買了鐵釘。這些關(guān)聯(lián)規(guī)則很有價(jià)值,商場(chǎng)管理人員可以根據(jù)這些關(guān)聯(lián)規(guī)則更好地規(guī)劃商場(chǎng),如把鐵錘和鐵釘這樣的商品擺放在一起,就能促進(jìn)銷售。有些數(shù)據(jù)不像售貨數(shù)據(jù)那樣很容易就能看出一個(gè)事務(wù)是許多商品的集合,但稍微轉(zhuǎn)換一下思考角度,仍然可以像售貨數(shù)據(jù)一樣處理。比如人壽保險(xiǎn),一份保單就是一個(gè)事務(wù)。保險(xiǎn)公司在接受保險(xiǎn)前,往往需要記錄投保人詳盡的信息,有時(shí)還需要投保人到醫(yī)院做人身檢查。保單上記錄有投保人的年齡、性別、健康狀況、工作單位、工作地址、工資水平等。年齡在40歲以上,工作在A區(qū)的投保人當(dāng)中,有45%的人曾經(jīng)向保險(xiǎn)公司索賠過(guò)。這條規(guī)是物品丙。可以看出,A區(qū)可能污染比較嚴(yán)重,環(huán)境比較差,導(dǎo)致工作在該區(qū)的人健康狀況不好,索賠率也相對(duì)比較高。系統(tǒng)的目標(biāo)與功能結(jié)構(gòu)二、為了全面提高學(xué)校的教學(xué)水平,各大高校在每個(gè)學(xué)期都會(huì)對(duì)每位教師的教學(xué)情況進(jìn)行綜合評(píng)價(jià),學(xué)校通過(guò)多種方式,收集和整理來(lái)自多方面的評(píng)價(jià)數(shù)據(jù)。加上個(gè)高校在職教師人數(shù)眾多,每位教師可能又會(huì)同時(shí)教幾門課,最后匯總的數(shù)據(jù)量非常大,處理起來(lái)要花費(fèi)大量的人力和時(shí)間。有的學(xué)校可能還是人工操作占大部分,這樣效率更低;大部分學(xué)校會(huì)借助一些信息管理系統(tǒng)進(jìn)行數(shù)據(jù)的處理,工作效率有所提高。但是,這也只能對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的處理,不能挖掘出這些數(shù)據(jù)中所隱藏的有用信息和知識(shí)。如何從這些海量的數(shù)據(jù)中獲取有用的信息,對(duì)教師的教學(xué)水平進(jìn)行更為客觀、公平和科學(xué)的評(píng)價(jià)。本系統(tǒng)所研究的內(nèi)容是如何對(duì)教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行挖掘,目標(biāo)就是從大量的評(píng)價(jià)數(shù)據(jù)中提取出一些隱含的、有用的信息和知識(shí)。一方面可以提高數(shù)據(jù)處理工作的效率,另一方面可以從中發(fā)現(xiàn)影響教師教學(xué)質(zhì)量的因素,進(jìn)而嫁衣改進(jìn)教學(xué)方法。這樣一來(lái),可以更好地為學(xué)校的決策和教學(xué)工作提供支持、建議,從而達(dá)到全面提高教學(xué)水平的目的。本挖掘系統(tǒng)是在mysql數(shù)據(jù)庫(kù)管理系統(tǒng)的基礎(chǔ)上構(gòu)建的,它其中提供的數(shù)據(jù)管理功能和數(shù)據(jù)挖掘功能能夠幫助實(shí)現(xiàn)系統(tǒng)的設(shè)計(jì)要求。Mysql在w

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論