基于粗糙集的人力資源評價的規則挖掘(1)_第1頁
基于粗糙集的人力資源評價的規則挖掘(1)_第2頁
基于粗糙集的人力資源評價的規則挖掘(1)_第3頁
基于粗糙集的人力資源評價的規則挖掘(1)_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于粗糙集的人力資源評價的規則挖掘(1)    摘 要 應用粗糙集理論和區分矩陣來挖掘各因素規則的方法對一個人力資源評價的例子進行分析和處理,挖掘評價規則,并從客觀的數據中得出了各主要因素的客觀權重。     關鍵詞 粗糙集; 人力資源; 規則; 權重    1 前言    粗糙集(Rough sets)理論是一種處理模糊、不精確的分類問題的新型數學工具。粗糙集理論已成為當前數據挖掘的主要方法之一,其主要思想是在保持分類能力不變的前提下

2、,通過知識約簡,導出問題的決策或分類規則。該理論已被成功地應用于機器學習、決策分析、過程控制、模式識別與數據挖掘領域。    人力資源是指社會所擁有的能為社會創造價值的人力或勞動力,其本質是人的能力而不是人本身,人力資源的價值在于人掌握的知識和技能,在于人為社會創造價值的能力。人力資源評價就是通過分析影響人力資源價值的主要因素,結合一定的評價方法,進而得出一個綜合評價值的過程。 2 粗糙集處理的基本步驟及算法     收集和整理數據,組成信息表。     數據預處理。將數據庫

3、中的初始數據信息進行分類、聚類分析以及使某些屬性的連續值離散化,轉換為粗糙集形式,明確條件屬性和決策屬性。     屬性約簡,根據預處理后的數據信息表生成區分矩陣,利用區分矩陣法生成約簡屬性集。 區分矩陣(Discernibility Matrix)是由波蘭華沙大學的著名數學家skowron提出來的,是近年來在粗糙集約簡上出現的一個有力工具。利用這個工具,可以將存在于復雜的信息系統中的全部不可區分關系表達出來。    定義1:設有信息系統S,a(x)是記錄x在屬性a上的值cij表示區分矩陣中第i行,第j列的元素,這

4、樣區分矩陣的定義是: (cij)    其中i,j1,2,3,n,這里n 。    在獲得區分矩陣的時候,還有一種情況沒有列出來,就是a(xi)a(xj),D(xi)D(xj)的情況,在有些資料中,將這種情況下的cij賦了一個1;有些則不討論這種情況,因為他們認為在數據表的預處理階段會對數據表中沖突的記錄做處理,使其不加入到數據中,并且將沖突的記錄數除以記錄總數,得到一個粗糙度的量度,該量度可以作為數據表的一個特征。本文遵從后一種處理方法,對沖突的記錄不予討論,認為數據表中沒有沖突的記錄。  &

5、#160; 定義2:區分函數是從區分矩陣中構造的,方法是把cij的每個屬性“或”起來,然后再“與”其所有的cij,其中i,j1, ,用p來表示。    區分矩陣是一個對稱 × 矩陣。在實際應用中,只計算它的上三角矩陣或下三角矩陣。    根據區分矩陣的概念,有三點值得注意:     區分矩陣中條件屬性組合數為1的元素項,即Card(cij)1,表明除該屬性外其余條件屬性無法將決策不同的兩條記錄區分開來,即該屬性必須保留,這個與決策表中核的概念一致。因此,矩

6、陣中所有條件屬性組合數為1的屬性均為核屬性。     區分矩陣中凡是條件屬性組合中包含有核屬性的矩陣元素都可以僅用核屬性就把決策不同的記錄區分開來,也就是說屬性組合中凡是包含有核屬性的區分矩陣項的其它條件屬性都是多余的。     對于不包含核屬性的屬性組合必然每個組合都至少有一個元素成為約簡后的一個條件屬性,否則決策表中的某些記錄將無法識別。    屬性約簡的基本過程如下:    第一步:生成區分矩陣,將矩陣中屬性組合數為1的屬性列入最

7、終的屬性約簡集合,即Red=Core= cijCard(cij)=1,i,j=1,2,3, 。    第二步:從區分矩陣中找出所有不包含核屬性且cij0屬性組合Q,即:Q cijcijCore=,且cij0,i,j1,2,3,     第三步:將所有不包含核屬性的條件屬性組合表示為合取范式的形式,即:P(cij),cijQ。    第四步:將P轉換為析取范式的形式,并進行化簡。    第五步:根據需要選擇不同的屬性組合作為約簡。

8、0;    選取約簡屬性后的信息表,對每個規則求出其核屬性,得到各規則的核值。    定義:具有相同條件屬性而有不同決策屬性的對象成為不可分辨的對象。    基本思想:考慮依次去掉各個屬性,若存在不可分辨對象,則說明該屬性為必要屬性,即核值。若去掉該屬性時,無不可分辨對象,則說明該屬性為冗余屬性,可省略。     根據核值表產生約簡規則。    基本算法:    輸入

9、:信息系統S=(U,CD, V, f )    輸出:約簡后的決策規則集。    步驟:     計算區分矩陣; int i=1,j=0;     int k=card(U);     M=;     while(1ik)     for(i=0;i ;ik)    for(j=

10、i 1;j ;jk)    if (D(xi) D(xj)     mij=a C:a(xi) a(xj)    else     M=M mij     得到CORE; i=1; CORED(C)=; 從頭取M中元素,若為單一屬性組合則將該屬性加入CORED(C),     進行屬性約簡 從M中刪除含有核屬性的組合。 Q cijcijCORED(C)=,且

11、cij0 P(cij) 將P轉換為析取范式的形式    P=(ci*) ci*為約簡的屬性集合        一約簡的屬性集合ci*,對每一個規則求核屬性    for(j=1;j ;jm)(m 為每個規則的屬性個數)    每次假設從規則中去掉一個屬性aj    if 不存在不可分辨的規則 then 去掉該屬性    

12、;else aj為該規則的屬性核值     根據每一規則的核值,列出約簡的規則集合。若對每一個對應的決策值該規則組合是既約的且在系統中為真時為約簡規則。     求出各約簡屬性的權重。    通常情況下,決策者會擁有對各個條件屬性的先驗知識,權重用來衡量屬性的相對重要性。在不同的決策環境下,相同的屬性對決策輸出會有不同的影響,即權重對環境敏感。粗集理論中的屬性重要度表達了當前數據環境下屬性對決策的影響,但它不能反映決策者的先驗知識。因此,將二者結合起來確定屬性的權重可以得到比

13、較理想的結果。這樣我們將粗集理論同決策者的先驗知識結合起來,即將由大量的歷史數據確定出來的客觀的屬性重要度同由主觀的先驗知識確定的屬性權重結合起來確定最終的綜合權重,從而實現主觀先驗知識同客觀情況的統一。    我們假設系統中的條件屬性為C,決策屬性為D。在C中有n個屬性a 1,a2,an。由決策者先驗知識給定的權重分別為p(a1), p(a2), , p(an)。然后收集大量的評價樣本,由這些樣本數據來考察所有條件屬性將樣本劃分為決策類的分類能力,并由決策屬性對條件屬性的依賴度rC(D)=Card(posC(D)/Card(U),其中Card表示集合的

14、基數。然后去掉條件屬性i后,在重新考慮分類情況,求出rCi(D)=Card(posCi(D)/Card(U),則屬性i的重要度為rC(D)rCi(D),以此類推。在此基礎上將各個屬性的重要度進行歸一化處理并把處理后的結果q(ai)作為屬性i的客觀權重。即 q(ai) 。顯然,q(ai)在0和1之間取值。得到各個屬性的主觀和客觀權重后,由于客觀權重是由歷史數據處理后得到的,我們賦予其較大的權重為60,相應地,賦予主觀權重為40,那么,由此確定的綜合權重P(ai)0.6×p(ai) 0.4×q(ai)。 3 應用實例     數據采集。在

15、人力資源評價中,各屬性值用3,2,1分別表示“優,中,差”。                  指         標         對         象知識 量a創新 能力 b交流 能力 c適應 能力 d畢業 院校 e健康 狀況 f心理 承受 能力 g進取 欲望 h評定 結果 i11122233322111211321323211212341212121115312223333622322333372211312228233312233     使用區分矩陣進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論