




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 巴蜀中醫藥古籍醫案數據挖掘系統構建及應用 聶佳任玉蘭江蓉星許霞摘要:中醫藥古籍是中醫藥傳承發展寶貴的知識財富,巴蜀中醫藥古籍特色突出。承載醫家豐富理論和臨床經驗的醫案,是知識發現不可或缺的研究對象。構建基于關聯規則方法分析的巴蜀中醫藥古籍醫案數據挖掘系統,不僅能深入研究巴蜀中醫藥學術流派的特色,亦能為中醫藥古籍數據挖掘系統開發和應用提供有效的支持。關鍵詞:巴蜀;中醫藥;古籍;醫案;數據挖掘系統;構建巴蜀地區獨特的地理和文化環境,造就了一批在傳統中醫藥方面卓有成就的名醫大家,如北宋的唐慎微、清代的齊秉慧等,尤其在中醫診療、方藥方面特色突出,給
2、后人留下了寶貴的醫案記錄,為祖國的醫藥事業繼承和發展作出了不朽的貢獻。本研究基于所收集1063部巴蜀中醫藥古籍中醫案的特點,利用現代計算機技術,構建數據挖掘系統,旨在深層次發現巴蜀歷代醫家辨證論治的知識信息,發揚巴蜀中醫藥文化。1.數據挖掘系統構建1.1總體思路數據挖掘能從大量的、不完全的、有噪聲的、模糊的、隨機的數據集中提取有效的、新穎的、潛在有用的知識和規律,具有處理海量模糊性、非線性數據及知識發現的優勢。本研究以中醫藥古籍資源的分析利用和知識發現為目的,在試驗相關數據挖掘技術特點和適用性基礎上,結合巴蜀中醫藥名家診治思路和特點,探索性地建立了基于關聯規則的辨證施治、用藥規律挖掘模型,并驗
3、證了其可行性,建立符合中醫臨床規律的數據分析方法,建造巴蜀中醫藥古籍數據挖掘的計算機模型。1.2主要構建步驟構建步驟共兩部分。第一部分先明確研究需要,定義研究數據,將原始數據通過數據轉換、加工等數據預處理方式,抽取正確可靠的數據,構建多維的數據倉庫挖掘模型;第二部分即根據不同的查詢條件進行數據挖掘,根據研究需要,選用恰當的數據挖掘算法,計算出滿足條件的模式集合,以數據條形式表達出來,調整參數進行模式篩選,通過挖掘前臺系統向導進行數據挖掘操作,將數據挖據信息以關聯規則形式展現給用戶,總過程如圖1所示。1.2.1數據的轉換和加工 從數據源中抽取的數據不一定完全滿足目的庫的要求,例如數據格式的不一致
4、、數據輸入錯誤、數據不完整等,因此有必要對抽取出的數據進行數據轉換和加工,包括數據過濾、數據清洗、數據替換、數據計算、數據驗證、數據加解密、數據合并、數據拆分等。本研究根據抽取數據的特點進行數據轉換和加工研究,主要包括數據清洗、噪音處理、數據規范。1.2.1.1缺失值的處理 在中醫處方信息中,有時會出現期望有數據的地方卻沒有數據的情況,如對臨床決策有重要價值的藥量等數據的缺失。針對數據的特點和對決策意義的不同,采用不同的缺失值填充算法,補充缺失數據。如針對樹脂類數據,缺失值采用平均值填充法。1.2.1.2噪音數據的處理 主要指針對一詞多義、多詞一義、詞義模糊、詞義交叉或涵蓋等噪音數據進行處理。
5、處理方法主要是根據中華人民共和國藥典中醫診斷術語標準中醫證候鑒別診斷學中醫癥狀鑒別診斷學中藥學方劑學等標準進行刪除或規范處理。1.2.1.3藥物名稱的規范處理 針對處方中對藥物的描述存在大量異藥同名、同藥異名等現象,本研究采用改進的編輯距離算法,對數學名稱進行自動化、智能化的規范處理。規范處理過程通過兩級數據規范實現。1.2.1.4癥狀名稱的規范 中醫古籍文獻對癥狀的描述常存在不規范性,多表現為癥狀名稱不標準以及癥狀表述的模糊性。為了使系統可以正確處理對癥狀的描述,本研究根據癥狀規范采用改進的編輯距離算法,對癥狀進行自動化、智能化的規范處理。規范過程與藥物規范一致。1.2.2數據倉庫的實施 構
6、建巴蜀中醫藥古籍數據倉庫的目標數據庫由藥物表、癥狀表、疾病表等構成。數據庫中各表根據情況向下細化到不能分解的原數據。各表之間的數據可以借助外鍵建立聯系,從而形成一個龐大的中醫體系結構。1.2.3建造數據挖掘模型 為了從多個維度、不同概念層次對藥物運用規律進行漸進分析,本項目基于中醫數據存在復雜冠詞,結合關聯規則建立了癥候關聯、藥物配伍等挖掘模型。1.2.4數據挖掘 運用多維關聯規則分析在不同維度下癥狀、證候、藥物的頻次和支持度,提取中醫某一疾病的多發癥狀、證候及治療所需常用藥物;運用關聯規則分析的頻繁項集分析中醫醫案中癥狀與證候、藥物與藥物等的配伍規律,計算癥狀、證候、藥物項集的支持度和置信度
7、,提取常用二元或者多元癥狀、證候、藥物配伍;采用多維關聯規則挖掘算法分析中醫辨證思路、處方選藥規律,分析不同年代、出處、文獻類型等條件下辨證論治規律。2.應用示范2.1功能界面操作用戶通過用戶名和密碼登錄巴蜀中醫藥數據挖掘系統,進入數據挖掘操作界面,見圖2。首先選擇“導入數據”選項,在目標文件中選擇準備數據挖掘的源數據,導入數據挖掘系統,然后根據研究需要,分別選擇藥物關聯、癥候關聯(癥狀與證候關聯)等選項,實現疾病與藥物、病因與癥狀等之間的關聯規則分析,達到數據挖掘的目的。2.2藥物關聯分析展示以圣余醫案為例,導入所要進行數據挖掘的源數據,點擊“藥物關聯分析”按鈕,在病名下拉選項中選擇“咳嗽”
8、,在藥物復選框中選中“全部藥物”,在支持度和置信度選項中選擇0.5,點擊“數據挖掘分析”按鈕,顯示出如下結果。見表1。從表1中可以看出,在圣余醫案中治療咳嗽所用的藥物配伍組合,支持度和置信度>50%的共有12條數據。其中,半夏與白術組合的支持度為78.95%,置信度為100.00%。說明該書記載咳嗽病醫案中,半夏和白術同時出現的頻率為78.95%;而當半夏或白術二者其中一味出現時,另一味中藥出現的概率為100.00%。可見,在圣余醫案中,醫家治療咳嗽時,半夏與白術是常用藥對,而且其單味藥使用頻率也是最高,均為15。半夏燥濕化痰、降逆止嘔,白術健脾益氣、燥濕利水,二者伍用倍增鎮咳化痰之功。3.體會本研究引進現代計算機技術,針對巴蜀中醫藥古籍醫案,探索性地構建基于關聯規則方法分析的數據挖掘系統,以期為中醫藥古籍數據
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 再生鋅企業數字化轉型與智慧升級戰略研究報告
- 增濕塔企業ESG實踐與創新戰略研究報告
- 電解槽企業ESG實踐與創新戰略研究報告
- 顯示儀表、記錄儀企業數字化轉型與智慧升級戰略研究報告
- 農產品初加工機市場分析及競爭策略分析報告
- 2024年中國聯通蒼南縣分公司招聘考試真題
- 中石油遼河油田分公司高校畢業生招聘筆試真題2024
- 2024年紹興市柯橋區稽山書院招聘考試真題
- 2024年泉州文旅集團招聘考試真題
- 2024年南陵縣事業單位引進考試真題
- 比例尺單元測試卷及答案
- 工程造價咨詢服務投標方案(專家團隊版-)
- 2024年廣東省中考生物+地理試卷(含答案)
- 小小科學家《物理》模擬試卷A(附答案)
- AVL-CRUISE-2019-整車經濟性動力性分析操作指導書
- 《新概念英語》第三冊課文詳解及課后答案
- 全尺寸測量報告FAI
- 【課件】第9課 美在民間——中國民間美術——剪紙課件-高中美術人教版(2019)美術鑒賞
- 幼兒園幼兒花名冊
- 動畫設計3ds max基礎—4-1-7創建復合對象—布爾教案
- 火災自動報警系統的選型及設置要點分析(共5頁)
評論
0/150
提交評論