論文發表中方差分析的常見誤用
眾所周知,方差分析比較常用的場合就是多組定量資料的比較,下面是小編搜集整理的論文發表中方差分析的常見誤用,歡迎閱讀查看。
應用中的主要幾個問題有:
(1)缺乏對數據的正態性檢驗,組間比較都采用方差分析,而不考慮秩和檢驗。
(2)兩兩比較直接采用t檢驗,而不是專門的兩兩比較方法。
(3)采用方差分析處理重復測量資料,增加假陽性錯誤。
(4)實驗設計考慮不周,誤用其它設計的統計分析方法。
第一種錯誤比較明顯,也都談了好多年了,應該說是老生常談的一個錯誤,只要大家有心,就不會犯這種明顯的錯誤。前幾天有人問我說:是不是組間比較前一定要做正態性檢驗,我看到好多人都沒有做啊,都是直接就用方差分析。
這里就這個問題談下個人觀點。理論上,一定要做,別人不做,有兩種可能,一是做了,只是沒有在自己的結果中提及而已;二是真的沒做。可能有的人覺得無所謂,不就是個正態性檢驗嗎,提得多了都煩了。但是前提條件這種東西,一定要有的。否則就失去采用方法的意義了。有時候,有的指標,可能比較明顯,肯定是正態,比如身高、體重等,可能你不提也沒事。但是從穩妥的角度,建議還是只管提一下。其實做了也就是一分鐘的事,文章中加上一句滿足或不滿足正態的話也不累贅,何苦不做呢?
第二種錯誤也是翻來覆去說了多少年了。兩兩比較不能用t檢驗,而要用兩兩比較的方法。而且兩兩比較方法的選擇在前面的文章中也有介紹了,所以這種錯誤案例我也不舉了。其實還是有很多。
下面主要通過2個例子來說明一下第三種和第四種錯誤。
例1:某研究欲分析某藥物對骨質疏松的治療效果,該研究將24只小鼠分為3組,第1組為正常對照組,第2組應用常規藥物(A),第3組聯合應用常規藥物和該新藥(A+B)。研究者對觀測結果分析后,發現第3組和第2組之間差異有統計學意義,結論認為新藥對治療骨質疏松有效。
筆者分析:這個例子在前面文章中層提到過,但是當時沒有從專業上解釋的詳細。應該說,這種形式的`設計在臨床中不在少數。這里從專業上再說一下。這種研究涉及兩個因素,每一因素各有2個水平,分別為常規藥物(A)使用和不使用、新藥(B)使用和不使用,因此兩個因素組合后為4種處理。該研究中第3組比第2組多了B藥,作者將兩組的差異歸因于多增加的B藥的效果,認為新藥對治療骨質疏松有效,這一結論還是值得商榷的。因為如果A和B之間有交互效應的話,第3組就不僅包含B的作用,而且有A、B之間的交互作用。兩組有差異可能是因為B的作用,也可能是因為A和B的交互作用。因此除非確定A和B之間完全獨立,否則不能下結論認為兩組差異是由于增加了B藥造成的。
建議:該研究更好的做法是增加一組單獨新藥(B)組,這樣就形成一個2×2的析因設計,然后采用析因設計的方差分析,既可以檢驗A和B的主效應,也可分析二者的交互效應。如果交互效應有統計學意義,可以提供更多的信息。
例2:某醫院欲探討準分子激光原位角膜磨鑲術(LASIK)對患者視野的影響,對實施LASIK的46例近視患者分別于術前、術后1天、1個月、3個月、6個月用Humphrey 視野計30-2SITA快速閾值檢測程序行視野檢查。該研究采用隨機區組設計的方差分析, 分析各時間點視野指數是否有統計學差異。部分分析結果列于下表。
筆者分析:該研究比較有代表性,目前臨床中有不少類似研究,即對同一群患者施加干預后分別觀察療前和療后不同時間點的指標值。在以前通常將此類設計歸為隨機區組設計中,將個體作為區組因素,時間點作為分組因素,統計分析采用隨機區組方差分析。甚至在我當年讀本科的時候,依然是這么講的,作為隨機區組設計。但大家慢慢發現,此類設計作為隨機區組并不合適。為什么呢?在隨機區組設計中,每一區組中的處理是隨機分配的,也就是說,區組中的樣品理論上是可以調換的。而本例研究中,時間點是無法隨機分配的,只能是依次觀察。你沒有辦法讓明天挪到今天的前面去,這一點決定了他們還是有不同的。所以不能混為一談。
建議:由于同一研究對象的多次觀察之間很可能具有一定的相關性,采用重復測量方差分析更為合適一些。重復測量方差分析目前已經在國內用的越來越多了,不像以前只會用普通的方差分析。當然重復測量方差分析要稍微復雜一丁點,但是并不是特別復雜,但是它能說明很多問題,比如發展趨勢問題,時間點的比較等等,都可以做到。關于重復測量方差分析會在后面文章中專門介紹。這里只是先簡單提點一下。
總之,方差分析就跟t檢驗一樣,看起來簡單,用起來并不然。尤其方差分析涉及的內容更多,設計類型也更多,這就注定了它一定要比t檢驗復雜一些。真正用對的話,需要考慮很多方面,如設計類型、數據分布、兩兩比較、獨立性等。方差分析是十分常用的,所以記住一些典型的錯誤案例,盡量在應用中避免這些錯誤,還是很有必要的。
【論文發表中方差分析的常見誤用】相關文章: