淺談基于關聯規則的高??蒲心芰υu價研究_第1頁
淺談基于關聯規則的高??蒲心芰υu價研究_第2頁
淺談基于關聯規則的高校科研能力評價研究_第3頁
淺談基于關聯規則的高校科研能力評價研究_第4頁
淺談基于關聯規則的高??蒲心芰υu價研究_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、淺談基于關聯規則的高校科研能力評價研究摘要:科研能力是高校的核心能力,也是反映高校實力的垂要指標。文 章在明確高??蒲心芰群幕A上,分析高校科研能力的構成,提出了 高校科研能力評價指標。采用關聯規則apriori算法對30所高校的科研 能力提取評價規則,結果表明,規則具有重要的參考價值。關鍵詞:高校;科研能力;評價;apriori算法一、引言科研作為高校職能的重要組成部分,對提高科技水平、提高高等教育 質量、開發高層次人才資源和促進社會經濟發展具有重要意義。高校作為 國家科研創新體系的重要組成部分,既是科學研究與知識創新的基地,又 是科研成果產出的基地。高??蒲幸恢笔俏覈蒲泄ぷ鞯闹厮=M成

2、部分, 在國家整個科研系統及經濟建設中的地位和作用h漸增長。科研能力是高校的核心能力,其高低已成為衡量一所高校綜合實力的 重要指標??蒲心芰Φ母叩筒粌H影響高校自身的發展,對高校所在地區的 經濟發展也冇重大影響。如何準確評價高校的科研能力已成為擺在政府、 企業和高校面前的一個十分重要的問題。影響科研能力的因素很多,且相 互交叉、相互滲透和相互影響,無法用確定的數學模型描述。目前,高校 科研能力評價方法很多,但普遍存在工作繁瑣、時間滯后等缺點,且人為 主觀因素對評價結果有很多的影響。如何快速、準確地對眾多高校的科研 能力進行客觀、公正地評價?這是一個冃前急需解決的問題。二、高??蒲心芰υu價體系的構

3、建高??蒲心芰τ伸o態能力和動態能力合成。高校靜態科研能力是高校 開展科學研究活動所固有的、潛在的能力,是開展科研活動的基礎,包括 5個方面:科技隊伍,它是構成高??蒲袆菽艿娜肆σ蛩?,是最積極也是 最活躍的因素,由人員素質、知識結構和梯隊組織結構構成;科研基地, 它包括科研機構、儀器設備、建筑設施等;科技學識深度、廣度及其相應 的載體;科研經費,它是構成高??蒲袆菽艿呢斄σ蛩兀豢蒲泄芾?,它是 保證科技活動正常順利進行的充分條件。高校動態科研能力是一種科技顯現能力,包括6個方面:(1)信息接 收加工能力。高校必須具有以最快的速度、最科學的方法在浩瀚如海的知 識庫中接收、分析和加工各種信息的能力,以

4、及汲収最需要最準確的信息 內容的能力,以力求掌握最前沿的科技信息和其他信息,把握科技發展的 最新動向。(2)學識積累與技術儲備能力,包括學習新知識新技術的能力 和將新知識新技術理論化系統化重新加工的能力。(3)科技創新能力。事 物的發展在于創新,科技的發展更需要創新。(4)知識釋放能力。科研是 復雜而繁重的腦力勞動,它具有探索性和創造性。在科研中需要深人的鉆 研、探索和創新,攻克理論與技術上的難關,創造出新思想、新理論、新 技術、新工藝、新材料、新產品、新軟件等,所有這些都存在一個知識釋 放的過程。(5)自適應調節能力。高??蒲忻嫦蛏鐣?、面向經濟建設,應 與社會和經濟建設緊密聯系,不斷根據社會

5、的發展調整高校的知識結構、 科研隊伍結構以及科研主攻方向等。同時,高校內部各學科之間、各科研 機構z間和管理部門z間等也存在互相適應和調節的問題。(6)科學決策 能力。高??蒲械母鳝h節,從科研方向的確定、優勢的發揮、特色的形成、 政策的制定,到課題的選擇與實施、科研人員梯隊組成等無一不需要科學 決策。這6方面并不相互獨立,而是互相交叉、互相影響。總之,靜態科研能力是進行科研活動的基礎和條件,必須通過動態科 研能力來釋放;動態科研能力是加工本領、實干技巧。兩者相互促進,缺 一不可。影響高校科研能力的因索很多,筆者僅以較為重要的11個影響 因素作為評價指標:科研隊伍(a)、科研基地(b)、科技學識

6、及其相應的 載體(c)、科研經費(d)、科研管理(e)、信息接收加工能力(f)、學識 積累與技術儲備能力(g)、科研技術創新能力(h)、知識釋放能力(1)、 自適應調節能力(j)、科學決策能力(k)o高校科研能力(l)用5個等 級來評價:很強、較強、一般、較差和很差,分別取值5、4、3、2、1。三、關聯規則的apriori算法關聯規則是要找出在某一時間或數據中會同時出現的東西:如果item a是某一事件的一部分,則item b也出現在該事件中的概率為x%。關聯 規則將特定的結論與一系列條件聯系在一起。關聯規則算法自動尋找那些 可通過可視化技術手段找到的關聯,如web節點,其優點是關聯可存在于

7、數據的任何屬性屮,它試圖尋找出多條規則,每條規則都可得出一個相應 的結論;其缺點是它試圖在一個可能非常龐大的搜索空間中尋找模型,將 耗費很長時間。它運用一種生成一檢驗的方法去尋找規則一一最初生成簡 單的規則,并被數據集證明是有效的。好的規則被存儲,所有的規則都受 到不同的制約,然后被專門化。專門化是一個將條件加入規則的過程。這 些新規則接著被數據證實是冇效的,而后這個過程反復地存儲尋找到的最 佳或最有意義的規則。用戶常對規則中可能的前提數目提出一些限制?;?于信息論或有效索引機制基礎上的各種技術,常被用于壓縮存在眾多規則 的搜索空間。該過程生成的最佳規則由圖展示出來,但這套規則不能直接 用于預

8、測,這是因為規則中有許多不同的結論。由關聯算法得到的關聯規 則稱為未精煉的模型。設i二il, 12,,im為所有項目的集合,d為事務數據庫事務t是 一個項目子集(t?鶴i)。每一個事務具有唯一的事務標識tid。設a是一 個由項目構成的集合,稱為項集。事務t包含項集a,當且僅當a?奇t。 最小支持度minsup即用戶規定的關聯規則必須滿足的最小支持度,它表 示了一組物品集在統計意義上的需滿足的最低程度。最小置信度minconf 即用戶規定的關聯規則必須滿足的最小置信度,它反應了關聯規則的最低 可靠度。關聯規則的挖掘就是在事務數據庫d中找出具有用戶給定的最小 支持度minsup和最小置信度minc

9、onf的關聯規則。如果項集的支持度超 過用戶給定的最小支持度閾值(minsup),就稱該項集是頻繁項集或大項 集。關聯規則有兩個步驟:根據最小支持度閾值找出數據集d中所有頻繁 項目集;根據頻繁項目集和最小置信度閾值產牛所冇關聯規則。關聯規則 有多種算法。apriori算法只可處理字符型自變量和結果變量。山于其只用字符屬 性,可利用智能型子集技術加快搜索速度。它提供五種選擇規則的方法, 使用一種復雜的指數方案以有效處理大型數據集。在執行節點前,字段類 型必須充分實例化。它對可保留規則數量沒有專門的限制,可處理有多達 32個前提的規則。apriori算法使用層次順序搜索的循環方法(乂稱作逐 層搜索

10、的迭代方法)產生頻繁項集,即用頻繁k-項集探索產生(k+1)- 項集。首先,找出長度為1的頻繁項集,記為li, l1用于產生頻繁2-項 集l2的集合,而用于產生頻繁3-項集l3的,如此循環下去,直到不能找 到新的頻繁k-項集。找每個lk需要掃描數據庫一次。利用如下公式來計 算所獲關聯規則的置信度。論文聯盟 ww. lwlm. com其屮,support_count (a u b )是包含項集a u b的交易記錄數目, support count (a)是包含項集a的交易記錄數目。利用頻繁項集生成規 則的算法描述如下:for all 頻繁 k 項集 lk, k?叟 2 do beginiii二l

11、k中規則的后件,該規則的后件中只有一個項目;call ap_genrules (lk, hl);end;procedure ap genrules (lk:頻繁項集,hm: m個項目的后件的集合)if (k>m+l) then beginilm+l=apriori_gen (ilm)for all hm+lwhm+1 do beg inconf二support (lk) /support (lk-hm+1);if (co nf?叟 min conf) thenoutput 規 貝ij lk-hm+1 hm+1 with confidence=conf and support=su

12、pport (lk)。對于存在大量頻繁模式、長模式或者最小支持度閉值較小時,apriori 算法將面臨以下不足:算法將花費較大的開銷來處理數目特別巨大的候選 項集;多次掃描事務數據庫,需耍很大的i/o負載。四、實證分析數據來源于某機構對高校科研能力的調查(見表1),每個指標得分越 高,說明該項科研能力越強。由表1可知,30所高校中,科研能力很強的 7所,較強的6所,一般的6所,較差的5所,很差的5所。由于關聯規 則的apriori算法需要對字符型變量來提取規則,所以需要對原始數據離 散化,離散化的標準是將得分劃分為0-19; 20-39; 40-59; 60-79; 80-100 五等,見表2

13、o采用apriori算法,令最低支持度為17%,最小規則置信 度為80%,最大前項數為1,得到8條關聯規則,見表3。五、結論由規則1可知,高??茖W決策能力較差(20-39)時,該高校的科研 能力很差(1);由規則2可知,高校知識釋放能力較差(20-39)時,該 高校的科研能力很差(1);由規則3可知,高??蒲薪涃M較少(20-39) 時,該高校的科研能力很差(1);山規則4可知,高??蒲嘘犖楹軓?80-90) 時,該高校的科研能力很強(5);由規則5可知,高??茖W決策能力較強 (60-79時,該高校的科研能力一般(3);由規則6可知,高校知識釋放 能力較強(60-79)時,該高校的科研能力較強(

14、4);由規則7可知,高 校科研基地一般(40-59)時,該高校的科研能力較差(4);由規則8可 知,高??蒲嘘犖檩^差(20-39)時,該高校的科研能力很差(l)o山此 可知,決定高校科研能力的重要因素是:科研隊伍、科研基地、科研經費、 知識釋放能力和科學決策能力,各高校應努力提高這些方面的科研能力, 以提高其整體科研實力。參考文獻:1. 劉薇薇國防工業高校科研能力趨勢評價研究價值工程,2010,(3)2. 朱文藻高??蒲心芰υu價指標體系的建立及評價安徽科技工程 學院學報,2003, (9).3. 謝邦昌數據挖掘clementine應用實務北京:機械工業出版社, 2008.4. 彭珍一種新的關聯規則挖掘方法計算機工程與應用,2009, (27)5. 史峰.matlab神經網絡30個案例分析北京:北京航空航天大學出 版社,2010.6. 劉兵,王雪蓮,戴景新,孟憲春高等學校科研能力評估方法研究. 科學學與科學技術管理,2003, (12): 85- 87.7馬凌芳高??蒲泄芾韯撔轮接懨禾拷洕芯?2003, (7): 49.8. 趙敏,馬衛華面向技術創新的高校科研管理工作探索及實踐科 技進步與對策,2003, (18): 89-91.9. 金明珠,邢丹英.高??蒲泄芾韯撔碌恼J識與實踐科技與管 理,2003, (4): 143-144.10. 馬修水,沈徽青普通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論