




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據時代的真實世界研究程良斌湖北省中醫院肝病科二、大數據時代的思維改變一、大數據時代三、真實世界研究目錄二、大數據時代的思維改變一、大數據時代三、真實世界研究目錄前言作者:[英]維克托·邁爾-舍恩伯格(ViktorMayer-Sch?nberger)著盛揚燕周濤譯2013年4月14日CCTV《對話》欄目陳偉鴻Vs
維克托大數據時代來臨大數據時代來臨數據到底有多大?一組名為“互聯網上一天”的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當于美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬……IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。大數據是什么?什么是大數據,其概念定義至今莫衷一是2012年8月份國際數據挖掘會議SIGKDD的大數據論壇,從數據存儲角度認為大數據應該是10臺服務器也無法存儲的數據,這樣的數據必須進行在線分析,否則計算機存儲無法支持;有專家從數據分析角度認為,數據結構很復雜,現有方法無法處理,必須采用類似谷歌的Hadoop平臺進行處理的就是大數據。到2013年,世界存儲的數據預計達到1.2澤字節(ZB=270),其中98%為數字數據今天我們所說的“大數據”和過去傳統意義上的“數據”的區別又在哪里?大數據的來源又有哪些?云計算“大數據”與“數據”的區別“結構化”、“半結構化”、“非結構化關于“結構化”“半結構化”“非結構化”可能從字面上比較難理解由于數據是結構化的,數據分析可以遵循一定現有規律的,如通過簡單的線性相關,數據分析可以大致預測下個月的營業收入額。目前,只有5%的數據是結構化而大數據是半結構化和非結構化的,其在分析過程中遵循的規律則是未知的,它通過綜合方方面面的信息進行模擬,它以分析形式評估證據,假設應答結果,并計算每種可能性的可信度,通過大數據分析我們可以準確找到下一個熱點大數據潛質的信息資源本質上,世界由信息構成物聯網,試圖在一切生活的事物中都植入芯片、傳感器和通信模塊,這個詞很像互聯網的姐妹,其實不過是一種典型的數據化手段罷了2009年,蘋果公司申請了一項專利,通過音頻耳塞收集關于血液氧合度、心率和體溫的數據今天,我們生活在一個計算型社會,因為我們相信世界可以通過數字和數學而獲得解釋——量化一切——把各種各樣的顯示轉化為數據耳掛、頭戴式16通道健康監護設備物聯網“棱鏡門”計劃泄密者,美國前中央情報局特工
愛德華·斯諾登
量化一切是數據化的核心數據化:將現象轉變為可制表分析的量化形式的過程數字化:把模擬數據轉換成可用0和1表示的二進碼,以便電腦處理世界的本質就是數據案例1:莫里繪制航海圖遠在1855年,時任美國海軍的馬修·方丹·莫里利用前人遺留的具有大數據潛質的航海日志,繪制出給航海業帶來巨大變化的航海圖。航海日志是船長個人的航海經歷的記錄,但這些經驗信息并沒有得到應用。而莫里在發現庫房中存留的大量航海日志后,他與20位從事數據處理的人,一起把破損的航海日志記錄的有用信息,通過數據提取,制成表格,整合數據之后,把整個大西洋按經緯度劃分成了5塊,并按月份標出了溫度、風速和風向等。于是,這些來自破舊臟亂航海日志的信息,變成了有效的航海路線圖。為了不斷地提高航海線路的精度,莫里要求航海圖的使用者都要將航行經歷,使用事先特定的表格繼續記錄成航海日志,他們再根據航海日志產生的數據不斷地修訂和完善航海圖。航海圖使用后使原航行路程縮短了三分之一,并大大減少了航行的危險,此后不僅得到美國海軍的使用,而且也被商船大量使用。案例2:谷歌預測甲型H1N1流感爆發2009年,在甲型H1N1流感爆發的幾周前,互聯網巨頭谷歌公司的工程師在《Nature》雜志發表一篇令人震驚的論文該文根據互聯網上5000萬條美國人最頻繁檢索的詞條如“哪些是治療咳嗽和發熱的藥物”等,與美國疾控中心在2003年至2008年間季節性流感傳播時期的數據進行比較,發現了45條檢索詞條的組合,再將它們用于一個特定的數學模型所預測的流感發病趨勢與CDC曾經預測的相關性高達97%該論文不僅預測了流感在美國全境的發生,還預測了在不同州或地方的傳播趨勢,而這樣的預測不像疾控中心只能在流感爆發1~2周之后才可以做到案例3:美國總統奧巴馬成功當選竟然靠的大數據案例4:挽救早產兒——生命本該不脆弱在加拿大多倫多的一家醫院,針對早產嬰兒,每秒鐘有超過3000次的數據讀取。通過這些數據分析,醫院能夠提前知道哪些早產兒出現問題并且有針對性地采取措施,避免早產嬰兒夭折而研究表明,早產兒的穩定有時不是病情好轉的標志,而是風暴錢的寧靜,就像身體的器官要做好抵抗困難的準備那些由于早產不幸夭折的孩子們在“特定時期”并不會有劇烈的生命體征變化,而通過大數據分析,只要及時進行醫療干預,這些災難完全可以避免啟示:大數據的魔力在于不僅僅是事后的分析評估,而是能夠在某種程度上“預知未來”。如果被預測出來的“時間窗口”事關重大甚至像上面的案例講的——“人命關天”,那大數據的價值將不可限量二、大數據時代的思維改變一、大數據時代三、真實世界研究目錄大數據時代的思維改變IBM的資深“大數據”專家杰夫·喬納斯(JeffJonas)提出:讓數據“說話”大數據時代的三個思維改變:首先,要分析更多的數據,有時甚至要處理與某事物相關的所有數據,而不是依賴靠分析少量數據樣隨機抽樣其次,研究數據如此之多,以至于不再熱衷于追求精確性最后,不再探求難以捉摸的“因果關系”,轉而關注事物的“相關關系”大數據時代處理數據上的三大轉變:要全體不要抽樣要效率不要絕對精確要相關不要因果核心觀點:大數據時代“因果關系”變得
不那么重要了大數據時代最大的轉變就是:放棄對“因果關系”的渴求,而取而代之關注“相關關系”。也就是說只要知道“是什么”,而不需要知道“為什么”這是對人們長時間積累起來的思維習慣的一次沖擊和挑戰,但當我們開始習慣用大數據的思維時,經過一段時間的積累,也許就會發現大數據的魅力了最重要的是:人們可以在很大的程度上從對于“因果關系”的追求中解脫出來,轉而將注意力放在“相關關系”的發現和使用上案例——因果關系臆想導致錯誤的理解案例1:手機是否增加癌癥發生率?丹麥癌癥協會(2011年10月,《英國醫學雜志》):研究分析了1990-2007年間358403手機用戶,在此期間,共有10729名中樞神經系統腫瘤患者,最后發現,手機與癌癥風險增加之間不存在任何關系案例2:美國折扣零售商塔基特(Target)與懷孕預測案例3:感冒與穿戴之間沒有直接關系案例4:汽車發電機故障與冰激凌2024/2/1124生活中并不缺少美,缺少的是發現美的眼睛——羅丹生活中并不缺乏數據,只是缺乏善于從數據中發現規律的方法隨訪13年HCC累計發生率1(N=3,653)隨訪11年肝硬化累計發生率
2(N=3,582)基線
HBVDNA(copies/mL)1對1991-1992年臺灣3653例HBsAg陽性的人群進行平均13年隨訪研究.Chen,etal.JAMA2006;295:65-73.2對1991-1992年臺灣3582例沒有治療的HBV患者進行平均11年隨訪研究.Iloeje,etal.Gastroenterology2006;130:678-686.高病毒載量與肝硬化及HCC風險增加相關
LinSM,etal.JHepatol.2007:46:45-52.對233例干擾素治療慢乙肝患者和233例無治療對照組患者進行中位數隨訪6.8年年)研究肝硬化累計發生率(%)(月)無血清學轉換血清學轉換01020304050024487296120144168192216P=0.03143.5%13.5%HBeAg持續陽性與肝硬化及HCC發生相關7460493932221464134106816452391752YangHI,etal.NEnglJMed.2002;347:168–174.對1991-1992年臺灣11893名男性進行長達10年的隨訪研究.累計發生率
(%)YearHBsAg+
HBeAg+HBsAg+
HBeAg–HBsAg–
HBeAg–RR=9.6RR=60.2臺灣11,893名男性HCC累計發生率24681012012345678910HBeAg血清學轉換與降低肝硬化的發生相關
HBeAg-陰性肝炎(23%)持續緩解
(0.5%)HBeAg逆轉
(55%)
269名臺灣自發HBeAg血清學轉換HBV攜帶者長期隨訪研究(基線時沒有肝硬化)Hsu,YSetal,Hepatology2002;35:1522-1527.40歲前實現HBeAg血清學轉換的患者
肝硬化的發生率顯著降低對240例基線ALT正常的HBeAg陽性的患者HBeAg血清學轉換的自然過程的長期研究.ChuCM,etal.JViralHepat2007;14:147-152.所以我們可以看到,大數據是繼承創新的源泉,也是繼承創新的有力工具利用大數據的繼承創新過程,不同于靠抽取小樣本產生的精確數據,通過因果關系的分析來回答“為什么”,但可以靠多源混雜全樣本,通過相關關系來較好地回答“是什么”,通過數據發聲,來幫助人們做出更加準確的決策和對未來的預測在大數據背景下的繼承創新之路,將會使人們從因果思維的束縛中得以解放,通過相關思維的世界觀,把更多的精力放在提高服務質量和能力上,放在解決發展中的具體問題上,他必將大大推進社會發展的進程和速度大數據背景下的繼承創新之路讓數據說話利用大數據的繼承創新過程,不同于靠抽取小樣本產生的精確數據,通過因果關系的分析來回答“為什么”,但可以靠多源混雜全樣本,通過相關關系來較好地回答“是什么”通過數據發聲,來幫助人們做出更加準確的決策和對未來的預測。在大數據背景下的繼承創新之路,將會使人們從因果思維的束縛中得以解放,通過相關思維的世界觀,把更多的精力放在提高服務質量和能力上,放在解決發展中的具體問題上。大數據時代,知道“是什么”就夠了,不必非得知道“為什么”,而是讓數據自己“發聲”繪制當代中醫航海圖的當務之急要轉變觀念,盡快從“因果關系”的渴求中解脫出來,高度關注“相關關系”,找到不斷提高中醫療效、提升服務質量和能力的根本途徑觀念的轉變是根本的轉變。“大數據時代對我們的生活,以及與世界交流的方式都提出了挑戰。最驚人的是,社會需要放棄它對“因果關系”的渴求,而僅需關注“相關關系”……這就推翻了自古以來的慣例,而我們做決定和理解現實的最基本方式也將受到挑戰?!敝嗅t學告訴你“是什么”而非“為什么”中醫學理論體系是一種“關系本體”,強調了主客體的一致、互動和相互影響。它以“效”—“陰平陽秘”為尺度,建立了醫者主體以及干預措施與患者客體功能狀態間直接的、復雜的相關關系,成為一個獨特的、系統的、可以有效指導臨床實踐的理論體系。這一理論體系是一個復雜的巨系統,她盡管還不能很好地從生物學的角度解釋“為什么”,但卻可以很好地告訴你“是什么”,而正是這些“是什么”已經給人類健康保障做出了巨大貢獻,同時也使其流傳數千年而不衰而大數據時代關注相關關系的強勁東風,無疑可以吹散當代科學長期以來追求“因果關系”而籠罩在中醫頭上的陰影,使中醫可以理直氣壯地沿著自身規律發展,更加道路自信、理論自信、方法自信。大張旗鼓地全力以赴通過相關關系,去尋找更加有效的方法、方藥,提高解決臨床難題的能力和水平,而不急于投入巨大的精力和資源,利用精確的“小數據”去回答“為什么”。二、大數據時代的思維改變一、大數據時代三、真實世界研究目錄臨床研究方法真實世界研究(RWS)隊列和病例對照研究(RCT)病例報告和病例系列真實世界研究:干預措施效果評價的新理念隨機對照試驗(RCT)與真實世界研究(RWS)RCT在很長一段時間內被作為治療性研究的“金標準”,在診斷疾病、評估藥物療效及預后、甄選治療方案等方面發揮著重要作用。但RCT通常在嚴格納入標準下入選研究對象,強調標準化及理想化樣本人群,不能代表臨床患者接受治療后的真實情況,這導致RCT結果存在一定局限性由于隨機對照試驗(RCT)在實際臨床研究中存在一定的困難性,近年來真實世界研究(realworldresearch,RWR)引起了醫務工作者的關注CER數據來源主要基于臨床登記,為真實世界研究(RWS)RCT與RWR的比較
1、臨床研究時期與研究目標:RCT關注的是效力研究(efficacytrials),RWR關注效果研究(effectivenesstrials)2、研究時間及設計方案以:RCT研究時間通常較短,以試驗性方法為主,類試驗為輔;RWR一般進行較長觀察的臨床觀察和隨訪,對健康結局有較好的評價,并根據不同的研究目標和內容選擇設計方案
RCT與RWR的比較
3、研究質量控制手段:高質量的RCT要求在廠家過程中采用隨機分配、盲法、標準化治療,有時甚至需要使用安慰劑,通過上述措施,可以對已知、未知的或未觀察到的混雜因素進行調整,這是突出優勢。但也可能產生三方面的弊端:一是限制結果的外推應用,在RCT中,如果多數患者因無法隨機接受干預治療而排除,那得到的結果也僅適用于與類似RCT中符合入選標準的病患;二是影響結果的可行性;三是不符合臨床實際。而RWR的設計思路與之相反,患者對診療的選擇完全取決于病情和自己意愿,是一個非隨機、開放性、不使用安慰劑的非盲試驗,與現實醫療環境更接近,不存在外推困難的問題,結果也相對真實可靠,但也由于“開放”產生了明顯的觀察者偏倚。
RCT與RWR的比較
4、研究納入和排除標準:RCT通常是在嚴格的納入和排除標準下入選研究對象,年齡寬泛。一般排除特殊人群及病情嚴重、合并癥較多的復雜病例,強調的是標準化樣本人群,即納入同質患病人群。這種高度選擇限制了許多RCT結果的應用。這些研究中所包含的病患往往與全體患病人群不同,不能代表日常醫療中遇到患者的真實情況,導致RCT所獲得的療效不能代表疾病的全貌,其代表性及外部真實性有一定局限性。Meta分析雖可累計病患的數量,但它基于RCT研究,無法解決研究人群與目標人群存在差異的問題。相比之下,RWR采用較寬泛納入標準和較少的排除標準,獲得一組與試驗結果外推人群保持一致的受試者,大大減少了選擇性偏倚。RCT與RWR的比較
5、樣本量和代表性:即使最完美設計和實施的研究也可能由于樣本量過小而不能準確回答研究的問題。同理,如果一個研究效力低的試驗未發現其差異有統計學意義,則無法確定是否兩種治療確無差異,還是由于樣本量小使結果產生偏差。所以,對于RCT和RWR來說,樣本量都是考察結果真實性的重要指標6、干預情況:RWR強調真實的治療,RCT強調標準化的治療
RCT與RWR的比較
7、結局測量指標與數據采集、管理及統計分析方法:RCT的結局測量多以一個或者一些特定病癥或體征為評價目標,而RWR結局測量多采用有廣泛臨床意義的指標,如病死率、復發率、傷殘程度、生活質量等,因此更具臨床實用價值;二者都強調應嚴格控制數據采集、管理和分析過程,所采用的統計學方法學方法基本相同,如卡方檢驗、Fisher檢驗、log-rank檢驗、ROC曲線、Kaplan-Meier生存曲線8、局限性:結論外推性較差是制約RCT的重要原因RWR雖很大程度上克服了該問題,但由于巨大的樣本量,使開展RWR的成本相對昂貴,龐大數據的收集整理增大了工作難度。使用注冊表分析時也可能存在潛在編碼錯誤和數據丟失的問題
RCT與RWR的比較隨機化納入/排除標準患病人群治療對照研究方案的治療和隨訪結果?---RCT設計---患病人群治療的適應癥進行治療暴露對照專門的治療和隨訪結果?---RWS設計--RCT與RWR的比較RCT應該用于評價有效性(efficacy),而RWS用于決定效應性(effectiveness)RWS提供RCT沒有的補充資料RWS能夠作為屬于藥物流行病學重要的工具用于決定臨床實踐中真實的效益、風險和治療價值RCTRWS真實世界研究——中醫臨床科研信息共享系統中醫臨床信息數據庫的建立——電子化系統在目前的中醫臨床研究中,臨床診療數據只是其中重要的一部分。為了更全面地從基礎醫學、臨床醫學和預防醫學角度進行研究,要整合臨床病歷和相關醫學研究數據,為中醫辨證論治個體化診療體系提供基礎原理支持和更深入的科學認識要建立醫學健康信息數據庫,整合并融合古代文獻數據、現代科技文獻數據以及HIS、RIS、PACS、病理、用藥等臨床理化檢測數據和基因表達、SNP、蛋白質組學、代謝組學以及新藥臨床試驗等醫學生物學研究數據,這樣利用大數據所開展的研究,不但能回答“是什么”,同時也可以回答“為什么”了公用模板科室模板個人模板結構化電子病歷模板體系數據庫體系——臨床科研共享平臺必填項設置與質控數據庫體系——臨床科研共享平臺病證結合模板集(科室模板集)模板標準化
前瞻性數據采集住院采集系統情況目前采集的病例數:1234例研究型門診采集系統情況重點病種采集病例數:170例
回顧性數據采集已采集2002年至今10年的重點病種住院資料1000多份;正在采集2002年以前的10年的重點病種住院資料1000份;下一步將對積聚、鼓脹、肝癌、黃疸等疾病作回顧性分析。
建院以來2萬病案的數據采集數據庫體系——臨床科研共享平臺分析處方使用情況,提取核心處方分析中藥頻次及各
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東農業大學《現代生物技術進展》2023-2024學年第二學期期末試卷
- 內蒙古自治區鄂爾多斯市康巴什區第二中學2025屆初三第二學期期末試化學試題含解析
- 唐山海運職業學院《現代數學與中學數學》2023-2024學年第一學期期末試卷
- 四川省樂山市五中學2025年初三下學期第二次月考物理試題文試題含解析
- 信陽農林學院《中國現當代文學名家論》2023-2024學年第二學期期末試卷
- 山東政法學院《中學數學教材研究與案例分析》2023-2024學年第二學期期末試卷
- 運輸合同書附加條款
- 二零二五版股權轉讓及委托持股協議正規范例
- 二零二五版個人診所醫生聘用合同書范例
- 智慧教育新探索
- 市長在市政協會議委員發言會上的講話
- 電纜溝工程量計算表(土建)
- 初中數學課堂教學中應重視學生閱讀理解能力的培養
- 優秀教案:接觸器聯鎖正反轉控制線路的檢修與測試
- 高二化學烴的衍生物.ppt課件
- 中國城市規劃設計研究院交通評估收費標準
- 配件來源及報價明細表
- IQC供應商品質管理看板
- 鋼結構安裝專項方案(電梯井)
- 生物工程設備教案
- 《三國演義》課外閱讀指導課說課
評論
0/150
提交評論