- 相關推薦
薈萃分析(Meta-analysis):潛能和功能
實施良好的薈萃分析可對一個可能導致不確定的和意見不一的結論的證據給出一個更為客觀的評價。從而防止將有效療法引入臨床實踐過程中不應有的延遲。對大量的具體的研究或具體病人數據的薈萃分析,可以驗證關于某一病人亞群的治療效果的先驗假說。可對各種研究結果的異質性進行探索,有時還可作出解釋。還可以生成那些在未來研究過程中有望解決的問題,而且可以準確地計算在研究中所需的樣本大小。在過去的十年中,醫學研究領域中有關薈萃分析的已發表的論文數量急劇
薈萃分析的案例
薈萃分析這一術語對統計學綜合和分析來自獨立研究的數據是恰當的,因為這個術語有其道理。Meta意指較晚出現的更為綜合的事物,而且通常用于命名一個新的相關的并對原始學科進行評論的學問。而其他術語則既不具體又不確切,例如“綜述”(overview)習慣上也可指傳統的文獻綜述,而“匯總”(pooling)意指源數據合并。最近“薈萃分析”一詞被列入醫學主題詞表和國家醫學圖書館的Medline檢索系統中。系統性綜述是指應用避免偏差的策略的和針對資料和方法部分的任何形式的回顧。系統性回顧可以包括也可以不包括正式的薈萃分析。
回顧歷史
獨立的研究的合并分析并非最近才有的。統計學家KarlPearson在1904年關于預防傷寒免疫血清的預防效果的報告,可能是運用正式的技術對合并不同樣本的數據進行分析的首次報道。而Pearson提出的原理仍然是現在的薈萃分析的主要的理由之一:“若考慮其中可能存在的錯誤,許多觀察組……樣本過小,難以產生任何明確意見!
第一個薈萃分析估計一種治療措施的有效性,發表于1955年。有趣的是,這種治療為一種安慰劑。對各種差異非常大的條件如術后傷口痛、咳嗽和心絞痛等應用安慰劑的有效性的平均值進行了計算,安慰劑對35%的病人有顯著效果。然而,在十九世紀七十年代在社會科學,尤其在教育研究工作中發展了更成熟的統計學技術。薈萃分析這一術語由心理學家Glass在1976年杜撰。薈萃分析被心血管病、腫瘤學、圍產期保健領域中的醫學研究者重新發現并用于隨機化臨床試驗研究分析。人們也倡導對觀測研究的薈萃分析及“交叉設計合成”(crossdesignsynthesis)(觀測研究數據與隨機化臨床試驗的薈萃分析結果的整合)。
后來,一個由臨床醫師、流行病學家和其他衛生專業人員組成的網絡建立。Cochrane合作組(以醫學干預評價領域的先驅ArchieCochrane的名字命名)的宗旨是準備、維護和發布醫療保健療效的綜合性系統的回顧。自從1992年Cochrane中心在牛津建立以來,這種研究便迅速發展起來,在歐洲、北美洲和拉丁美洲、非洲和澳洲建立了15個中心以,又有數以百計的遍布世界各地的個人參與合作。
不受歡迎的統計病態面孔?
盡管薈萃分析被廣泛應用,但它一直是一項引起爭議的技術。一些擁護者認為“一旦有可能薈萃分析就應取代傳統的單主題的回顧性文章”,其他的人則把它看作是一個“新的禍根”,為一種“不受歡迎的統計病態面孔”和“應該把它扼殺在搖籃里”。這種接受性的巨大反差并不奇怪。從臨床的角度來看,合并一組具體研究的結果也許并不適合,因為它生成一個群體“平均”治療效果,而臨床醫師想要了解怎樣才能最佳醫治他或她的具體病人。對同一問題的薈萃分析可以得出截然相反的結論,如對低分子量肝素防止手術前后血栓形成的評估。及對二線抗風濕病藥物治療風濕性關節炎的評估。但事情很明顯,為了從先前的研究中獲得最大的收獲,正確的文獻回顧策略應越來越普及及予以高度重視。
敘述性綜述
傳統的敘述性綜述有其不足之處,而薈萃分析似可克服這些缺陷。典型的綜述是主觀的,因此它易引起偏差和誤差。因為沒有正規的規則作指導,評論家們可能對一些基本問題產生分歧,如應該包括何種類型的研究,應該如何平衡所獲得的定量證據。選擇支持作者觀點的內容非常普遍:臨床實驗被引用的頻率與他們所得出的結果有關,與流行觀點相一致的研究比觀點不一致的研究被引用得更頻繁。一旦收集好一組研究,傳統的對研究結果綜述的方法是計算從各方面支持該一論點的研究的數目,并選擇得到最多認同的觀點。這個步驟無疑是有缺陷的,因為它忽視了樣本大小、作用大小和研究設計。因此難怪應用傳統的方法的分析家們常常得出截然相反的結論,并且往往忽略了微小的,但可能有重要意義的差別。臨床醫學飽受相反結論之苦,而評論家似乎應有責任去平息這些爭論。然而,在爭論中,從同一證據實體得出的相反的結論可能與評論家的專業有關而不是數據本身。通過整合實際證據,薈萃分在被檢查的總數為136個的115個試驗中析可以有更客觀的評價,因此當遇到原始研究、傳統的綜述和編輯意見相左時,薈萃分析可能幫助解決不確定性。
單個研究的局限性
單個研究常常既不能發現也不能排除兩種療法較小的但與臨床有關的的差異。一個試驗可能顯示無顯著療效,然而事實上療效確實存在,因而可能產生假陰性結果。這是一種II型誤差,對某一治療效果、樣本大小和顯著意義水平的差異,這種誤差的出現的概率可能被計算出。通常I型誤差較好識別——當一個試驗隨機產生顯著差異時,這種誤差的概率反映在P值。一個對報道在試驗組和對照組之間治療無顯著差異的臨床試驗的調查顯示,在臨床研究中出現II型誤差相當普遍:對一個臨床療效的差異,在被檢查的總數為136個的115個試驗中遺漏這一作用的先驗概率(在某一樣本大。┏^20%。臨床試驗中所包含的病人數常常不夠充分,這種情況在新近的幾年中幾乎沒有改變。在某些情況下,那些必須的樣本大小仍然很難達到。例如有一種藥物,它能使心肌梗塞的致死風險減少10%,而僅在英國每年就可以延長成千上萬病人的生命。要想測出這種藥物效應并具有90%的確定性(要求II型誤差不得超過10%),那么一個治療組就需1萬多個病人。
為取代如此巨大而昂貴、邏輯解釋又較困難的研究,薈萃分析看來是一個非常吸引人的選擇。可利用幾個較小的但具有可比性的評估相同的或類似的藥物試驗的數據。通過這種方法容易獲得所需病人的數量,并可以按可信度發現或排除相對較小的藥物效應。
同樣,薈萃分析有助于估計研究結果的普遍性。某些具體研究的發現可能只有在與該研究人群具有相同特性的病人群體中才有效。如果在不同的病人群體的實驗發現具有類似結果,那么可以得出結論這種干預的效果具有普遍性。通過集中所有可獲得的數據,薈萃分析比單個試驗能更好地回答關于一個總體研究結果是否在各個亞群中(如男性病人、女性病人或疾病的嚴重程度不同的對象)存在差異。隨著這一系列文章的討論的展開,這些問題將加以闡明和分析,往往可
【薈萃分析Meta-analysis:潛能和功能】相關文章:
對AMIS的功能需求分析03-21
“什么”的功能和翻譯11-21
兒童文學的功能及應用分析論文11-10
基于公司治理的內部審計功能分析03-24
中國山水畫的意義和功能06-14
內部審計功能和ERP的實施過程03-24
電子商務模式下的ERP功能需求分析03-21
試論美育對學生右腦和智力的開發功能03-19
康德的綜合和分析概念03-26