




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、醫學數據挖掘期末論文數據挖掘技術在中醫方劑研究中應用的探討學生姓名專業學院2016年6月數據挖掘技術在中醫方劑研究中應用的探討湛薇摘要:現有的中醫方劑數據存在冗余大的、不一致的、無效的噪聲數據,降低了中醫方劑數據的利用,且其方劑數據需要更加高效的存儲、查詢以及共享。而數據庫技術融匯了人工智能、模式識別、模糊數學、數據庫、數理統計等多種技術方法專門用于海量數據的處理1,從而解決中醫方劑研究中所存在的問題,提高利用效率并且發掘潛在信息。本文利用關聯規則、聚類分析、分類模式等數據挖掘方法,揭示方劑配伍規律的研究,對中醫方劑信息的問題進行探討。關鍵詞:中醫方劑;數據挖掘技術;關聯規則;聚類分析;分類模
2、式DataminingtechnologyappliedinthestudyofprescriptionoftraditionalChinesemedicineZhanWei【Absract:ExistingintraditionalChinesemedicineprescriptiondataredundancy,bignoise,inconsistent,invaliddata,reducestheuseoftraditionalChinesemedicineprescriptiondata,andtheprescriptiondataneedtobemoreefficientstorag
3、e,queryandsharing.Andthedatabasetechnologyofartificialintelligence,patternrecognition,fuzzymathematics,database,mathematicalstatisticsandsoonthemanykindsoftechnicalmethodsspecificallyformassdataprocessing1,soastosolvetheproblemsintheresearchofTCMprescriptionsandimprovetheutilizationefficiencyandexpl
4、orepotentialinformation.Basedonassociationrule,clusteringanalysisanddataminingmethodssuchasclassificationmodel,revealsthelawofherbalresearch,discussestheproblemofprescriptionoftraditionalChinesemedicineinformation.Keywords:PrescriptionsoftraditionalChinesemedicine;Dataminingtechnology;Associationrul
5、es;Clusteringanalysis;Classificationmodel1引言中醫學信息化在這幾年來發展迅速,大量中醫方劑數據庫已被構建與完善,但中醫方劑的數據挖掘方面依然有很多亟待解決的問題。雖然眾多已經構建的方劑數據庫都是經過一系列的校正后的結構化數據庫,但由于在浩瀚的中醫歷史之中,其年代跨度實在太大、朝代變更下使用的文字、記敘方式與特點的差異懸殊,使得方劑信息依然不可避免的會出現方劑數據不一致、錯誤、冗余等問題。數據挖掘技術在數據中正規地發現有效的、新穎的、潛在有用的,并且最終可以被讀懂的模式的過程。具有善于挖掘超大型數據庫、非手工地發現隱含知識、增進人類知識的特點2,因此,數
6、據挖掘技術對于中醫方劑研究所存在冗余的、不一致的、錯誤的等一系列噪聲數據的解決具有重大意義。另一方面,而中醫方劑配伍從本質上來說表現在方與方、藥與藥、方與藥、藥與劑量,以及方藥與病、癥之間的交叉錯綜的關聯與對應。數據挖掘正是通過數據特征、關系、聚類、趨向、偏差和特例現象深層的多維分析,來揭示數據間復雜特殊的關系,發現隱含規則模式和規律。2方劑配伍研究中的數據挖掘方法2.1 關聯規則關聯規則是數據挖掘中的一項重要技術,反映大量數據中項目集之間的關聯和相關聯系。關聯規則也是目前用于中醫方劑配伍研究中最經典的一種方法,一般通過降維處理將復雜的病、癥、方、藥關系分解,研究藥與藥、方與方、藥與癥狀等兩者
7、之間的關系。基于關聯規則的研究呈現如下特點:主要研究藥與藥之間的關聯關系,其他病癥、病方之間的關系研究得較少,研究對象包括某一類方或者治療某一病癥的方劑。研究方法不能證明具有普遍適用性;關聯規則的算法參數,即最小支持度大部分為10%£右,支持度偏小,使得發現的關聯關系的可信度不高。2.2 聚類分析聚類分析即按照相似性和差異性的分布,將數據對象按照不同的屬性特征聚集為不同的類,然后結合領域知識對方劑的配伍規律進行分析。聚類分析的算法有很多種,如基于劃分的聚類算法、基于層次的聚類算法、基于密度的聚類算法、基于網格的聚類算法等,不同算法在不同領域以及數據集上得到應用。在方劑配伍規律分析領域
8、,使用較多的事層次聚類方法,也可采用模糊聚類方法建立模糊相似矩陣類分析藥物之間的相似度。模糊聚類方法以模糊數學中的聚類方法為理論基礎,通過建立模糊矩陣最終獲得聚類結果,其方法簡單易行,在處理小數據量上可以收到較好效果。層次聚類算法可以對給定的數據集進行層次的分解,直到某種條件滿足為止,具體分為凝聚和分裂兩種方法。該算法簡單快捷而且能有效地處理大數據集,但是合并或者分裂點的選擇至關重要,直接決定了聚類結果的質量。采用模糊聚類的研究對象多是古代經典名方,研究內容是具體方劑的組成原則,即方中君臣佐使藥物的確定,驗證結果的方法是中醫方劑的傳統理論,此種研究尚處于探索階段。而其結果的準確性未被廣泛驗證,
9、但是該方法對于方劑配伍規律的理解以及配伍規范化具有重要作用。層次聚類算法的研究對象為治療某一病癥的復方,依據單味藥功效進行聚類,獲得若干個藥物組合類別,結合病的臨床癥狀推斷證型和用藥,這種研究方法在一定程度上研究了藥證與藥方之間的關系,并對臨床治療疾病具有指導意義。2.3 分類模式分類模式是根據數據集的特點構造一個分類器,利用分類器對未知的樣本賦予類別的一種技術。分類算法主要有決策樹、人工神經網絡、貝葉斯網絡等。不同分類方法會產生不同的分類器,分類器的優劣直接影響數據挖掘的效率與準確性。通過分類模式可以實現多角度的方劑分類和方劑功效的判定。在方劑的分類模式研究當中,目前常用的分類算法有人工神經
10、網和支持向量機方法。運用這些方法基于已知的方劑分類標準,可以將大量方劑按照組方藥物的功效、性味或歸經等眾多維度、多角度分成若干類,或判定單個方劑的功效,從而對理解方劑中藥與藥、藥與法、藥與證等之間的關系奠定研究基礎。著方面的研究雖然取得某些成果,形成了多個方劑分析系統,但是涉及的訓練集僅是治療某些病癥或者一部著作記載的方劑,缺乏選取大量數據對這些系統的分析結果進行驗證。因此分類模式研究方劑配伍規律有待選擇多種算法開展深入研究。2.4 研究方法的分析首先,從采取的數據來源看,主要有三類。一類是以現有的中醫文獻數據庫或者辭典為基礎選取治療某類疾病的方劑作為研究的數據;一類是以某段時期的文獻為基礎選
11、取治療某類疾病的方劑作為研究的數據;還有一類是以一些名醫的臨床治療處方作為研究數據。總體來看,方劑文獻的來源趨向于多樣性,這給方法的有效性和深入性地研究帶來了難度。其次,基于當前的文獻研究,可以依據擬解決的問題對前面提到的三種數據挖掘方法的適用范圍歸類。關聯規則所解決的問題包括:治療某一病癥的用藥規律,即藥物間的關系;癥狀間的關系;藥和癥狀的關系;藥和證的關系。聚類分析所解決的問題包括:方劑中藥物君臣佐使的配伍關系;治療某一病或證的基礎方法。分類模式所解決的問題包括:方劑的功效歸納,方劑的屬性歸納。最后,從挖掘對象來看,呈現多樣性。從單味藥到一類藥;從單個復方劑或治療某一病癥的復方。其中關聯規
12、則挖掘的對象包括治療某一病癥的復方、某一類復方、某一類藥等,分類模式挖掘的對象包括某一類方網。3數據挖掘以分類關聯規則為例,在分類關聯規則挖掘中,支持度和置信度是描述分類關聯規則興趣度的兩項重要指標。支持度反映規則的普遍性,置信度反映規則的可靠性4。若最小支持度閾值取2%猶豫傷寒雜病論中的方劑數量為286首,286X2%>5,意味著要選擇頻次大于5的要不進行分析。綜合仲景標準DB數據庫,認為此最小支持度閾值的取值對研究可行。置信度白公式Confidence(A->B)=P(AIB),揭示了A出現時,B是否也會出現或有多大的概率出現。如果置信度為100%W說明A出現時B必定會出現;如
13、果置信度太低,則說明A的出現于B是否出現關系不大,故最小置信度閾值為50%數據挖掘部分結果如表1至3所示。技1Zf西己IHlhl內關打工W見Ml表守趣則削忤次Mg后ft里歸度現刈中各類n一(h-配伍(哂性(X>bAUtic"-'-5H令人什皎A杯楨)一131舊T-一»-+-*»*H7(為療八隨比)*1M1IOUMK11M3aa.-4口一105(人電八廣1術一<-*1<X)心<>13一一-F-r-.八21CM<'1A口l1ft卜一回|IM1機*1125-*-a-*-a-表之方劑配伍與炳仁E關聯現則較庠琳則面杵現M后
14、件M值度理則迎叫加件號t方刑配伍(病t毋)w散領政力劑數,P-F«.»*-,pn*31H-卓門H8小蟀幀】一iMSQ714ISa-««WT+a+«a«««*s7半鴕卿華A短詠戶1iM比5710721-M-*a*-*-»-12ri.空八人跟四黃萼卜一<MUXIONBB24*a*-*-NBB-u-22f1&A附子>一(4>)72.7,K1155-X=-*-*-H4=-2Sf半旦人十美"兒荽f(哄門)HHk775K-上-*-*-*-»a-表3方刑配伍L同於左聯覘則表
15、仔規則的件規則后件置信度MM戰婚前件各類號方劑配伍)f耦箝)(惴i二款頤數方劑粗111T草丸也枝兒大學立大黃ItL詡iao66他27,麻黃人細辛A黃連1一南明心100'1FTII回附于上耳樸1*1少用病】LOO66fi511自芍A人器人黃茶J一19同病1100I2.17)=+B-14-F*WPFIB»-i-P-F桂枝A阿腹1f【厥陰病1100447通過數據挖掘,發現以下規律:按病性歸類時,多選用麻黃、桂枝、生姜、大蔥等辛熱之品來治療寒證;多選用黃苓與其他補虛或瀉火實藥配伍來治療熱證;多用茯苓、甘草、附子、白術等來治療虛證;多用甘草、麻黃、杏仁等藥來治療在表的疾病;病位在里的疾病,如治療病位在脾胃的疾病則多選用細辛、五味子、半夏、干姜等;治療病位在膽的則多選用柴胡、黃苓等。按病勢歸類時,發現治療太陽病時一般選用桂枝、生姜、甘草、大棗、大黃;治療陽明病一般選用黃連、柴胡等;治療少陽病一般選用桂枝、白芍、大棗、甘草、厚樸等;治療少陰病一般選川烏、人參、白芍、黃茂等。綜上,得出傷寒雜病論中的條文在治療疾病時。多根據所治疾病的病性、病位和病勢的不同來選擇、搭配使用不同藥物。4總結本文分析了數據挖掘技術在中醫方劑研究中應用的探討,對幾種方劑配伍研究中的數據挖掘方法進行詳細的分析,也利用數據挖掘技術研究傷寒雜病論中的方劑藥物配伍規律,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年街道牌項目投資價值分析報告
- 血透瘺管護理常規培訓
- 2025至2030年汽車機油泵綜合性能試驗臺項目投資價值分析報告
- 門迎接待流程培訓
- 2025至2030年姑嫂餅行業深度研究報告
- 2025至2030年可鎖定腳輪行業深度研究報告
- 2025至2030年北京紅星二鍋頭酒項目投資價值分析報告
- 2025至2030年全貼皮仿實木門行業深度研究報告
- 臨床護理服務流程試題及答案
- 2025至2030年中國有機硅硅橡膠項目投資可行性研究報告
- 中國理念的世界意義智慧樹知到答案章節測試2023年東北師范大學
- 隧道地表注漿施工技術交底
- GB/T 8905-2012六氟化硫電氣設備中氣體管理和檢測導則
- GB/T 39430-2020高可靠性齒輪毛坯技術要求
- GB/T 20473-2006建筑保溫砂漿
- GB 4789.3-2016食品安全國家標準食品微生物學檢驗大腸菌群計數
- 山西臨汾市人民醫院招考聘用39人【共500題含答案解析】模擬檢測試卷
- 化學反應的限度和化學反應條件的控制 課件
- FZ/T 62033-2016超細纖維毛巾
- 馬克思個人介紹
- 2022年成都市武侯區社區工作者招聘考試筆試試題及答案解析
評論
0/150
提交評論