- 相關推薦
可重復危機是如何形成的
你有聽說過可重復危機嗎?那么可重復危機是怎么形成的你又是否清楚呢?可重復危機是如何形成的是小編想跟大家分享的,歡迎大家瀏覽。
即使facebook和twitter上關于可重復危機的討論在心理學家之間已經吵翻了天,在國內也很見到討論。作為一個萬年醬油黨,對這個領域的“熱點”還是一直在關注。大約四五年前,也曾與人爭論,心理學的研究到底是否可靠,也曾以問答的形式,介紹了當時剛剛“興起”的可重復危機。幾年之后,再來看這個問題,發現這個問題不僅沒有解決,反而引起了一波又一波更大的爭議和騷動。在心理學家之間,甚至引起了人身的攻擊(言語上的)。這是我作為一個想要進入心理學學術界的年輕人所沒有想到的。
即然有問題,或者說很大一部分人覺得有問題,那么,這個問題到底是什么,如何解決這個問題,就成為了這個領域的必須去面對的。
誠然,如許多人所提到的,可重復危機不是心理學一個領域的問題,許多其他領域也存在。但是,記得某位心理學家(忘記了出處和原話):心理學是我們(心理學家)所唯一擁有的。所以,知道其他領域同樣存在可重復的問題,并不能是我們忽視這個問題的原因。
可重復性問題到底是從何時開始的?
作為一個喜歡追蹤文獻、每周必看science和nature目錄的博士狗,“有幸”在這個危機開始的時候,圍觀了一系列在science和nature上被報道而引起廣泛關注的事件,在這里把個人所了解的相關事件作一個回顧。
事件1:
Bem (2011)的預見未來的實驗。在這個標題為“Feeling the future”的文章中,已經是知名社會心理學教授的Bem在人格與社會心理學的頂級期刊Journal of Personality and Social Psychology上指出:通過9個實驗,包括了1000多名被試,他發現了未來發生的事件,可能會影響到被試當前行為反應。在這個頗具有預見性的討論中,他討論了統計方法、可重復性和這種預見未來現象的問題。當然,心理學界的人很快提出了質疑,兩個研究小組采用貝葉斯統計對他的數據進行了分析,表明無法從數據中得到這個推斷。更加晚一些重復實驗也沒有發現Bem的這個結果。此時,人們還無法預知,這個事件將成為心理學可重復危機的一部分。science此時也只是用相當平淡的口吻給了一個評論:ESP paper rekindles discussion about statistics。
事件2:
到2011年年末,另一重磅事件,徹底讓人們開始反思心理學中方法的嚴謹性了。這就是Stapel的論文造假事件。Stapel本人是荷蘭Tilburg University社會心理學的教授,刻板印象方面的專家。2011年4月8號,也就是五年前的今天,他在science上發表一篇題為 “Coping with Chaos: How Disordered Contexts Promote Stereotyping and Discrimination”的論文。這對于當時的我來說,實在是太有趣了:凌亂的環境居然會加重人們的刻板印象,太神奇了!對于這種有趣的研究,我很快在心理學與腦科學的論壇52brain.com上進行了傳播。但是到了2011年11月01日,Nature報道,Stapel的這篇論文涉嫌造假,標題是“Report finds massive fraud at Dutch universities”,而Science也撤回了此論文(2011.12.02)。此后,nature 和science都對這個事件進行了持續的關注。Stapel之所以能夠被發現是數據造假,是因為他的研究生舉報。而Tilburg于2012年12月的調查報告顯示,在他職業生涯中發表的137篇論文中,有55篇數據完全是捏造的。此外,還包括他指導的10個博士生博士畢業論文中的數據。在另外10篇論文中,當時還無法斷定是否有造假行為。Science在報道這個最終報告的時,提出一個事實:整個心理學領域都有無法推脫的責任(Final Report on Stapel Also Blames Field As a Whole),因為Stapel的55篇數據造假的論文中,審稿過程中完全沒有發現問題。而這并不是說審稿的過程是無法發現問題的,因為在2012年,賓大沃頓商學院的Uri Simonsohn通過對Smeesters已經發表的兩篇論文結果進行了仔細的檢查之后,懷疑作者的數據有問題,隨后Smeesters所在的大學對其進行了調查,Smeesters聲稱自己由于某些客觀原因,原始數據丟失,但是其所在大學無法接受他的這個理由,接受了其辭職(見science的報道)。
事件3:
還是回到2011年,Simmons, Nelson, & Simonsohn 在psychological science上發表了一篇名為False-Positive Psychology的論文,在這個論文中,指出了心理學研究中,有一些比較常見的做法會讓整個領域的假陽性過高。不過這個文章僅在學術界引起了一些關注,媒體的報道相對較少。
事件4:
2012年1月,無法重復的啟動研究。在中國的農歷尚未到2012年之時,社會心理學的社交網絡圈爆發了一個新聞:著名的老年啟動效應無法重復出來。記得在哈佛的幸福課(positive psychology)中,講課的老師就引用過這個研究,讓我印象深刻:當大學生看到一系列老年相關的詞匯之后,他們走出實驗室的速度會變慢,也就是說,變得更像老年人…….。當時我并沒有特別在意這個研究。但是2012年1月,開源雜志Plos One發表了Doyen等人一個研究,聲稱無法重復出這個著名的效應。他們做了兩個實驗,第一個實驗完全重復Bargh等人的實驗,第二個則對參與實驗的人進行了某種暗示,再現了這個效應。對于這個結果,科普作者Ed Yong進行了報道,并且開頭引用了心理學教科書中著名的歷史安全“聰明的漢斯”的故事,暗示原作者們Bargh等在方法上的嚴謹性。正常情況下,這種無法重復的原因多種多樣,對于批評可能也無需太在意。但是Bargh作為自動化加工(automatic process)方面的權威,面對這個研究和報道,表示非常憤怒,在自己的博客上進行了激烈的反擊,對重復實驗的作者、發表重復實驗的雜志以及報道這個重復實驗的科普作者進行抨擊,語言比較激烈,后來刪除了該博客(可以從這里和這里找到當時其他博客上的一些引用)。正如其他信息的傳播一樣,客觀理性的內容往往很難引起注意,但是充滿情緒的內容總是非常廣泛地傳播,于是Bargh的博客在社會心理學家之間傳播開來。
Bargh這個博客引起廣泛爭議的同時,應該說是再次讓社會心理學家們感受到了可重復問題的壓力。
于是一個原本不太受到對于的網站進入了大家的視野,這就是http://psychfiledrawer.org/。這個網站的目的是讓心理學家把自己未發表的數據上傳,以減少在論文發表中對陽性結果偏愛而陰性結果無法發表的這個問題。原本沒有人多少人關注這個網站,但是Bargh事件之后,許多人紛紛把自己重復過的數據上傳。更有意思的是,諾貝爾經濟學獎得主卡尼曼也站出來說話了。在題為“A proposal to deal with questions about priming effects”的郵件中,他老人家讓社會心理學家解決自己領域的問題。這個郵件內容也有不少的閱讀者。
事情發展到2012年,越來越多的重復失敗結果被曝光
要么是在一些網站上公開數據,要么是在一些學術期刊上發表。而對于Bem預見未來的實驗,也有重復實驗的報告在plos one上發表出來。心理學家也開始討論怎樣的重復才能算是一個合格的重復實驗。于是有了預先注冊(pre-register)、然后按照注冊的方法進行實驗,最后來報告結果。perspectives on psychological science上,也有專刊來討論可重復性的問題,這一次非常集中地討論了與可重復性相關的問題。同樣重要的是,2012年,John等人關于可疑研究操作(Questionable Research Practices)的調查報告發表,心理學家們承認,自己在研究的實踐中,一些通常的做法其實是大大地增加了假陽性的概率的。
直到2013年,Center for Open Science(COS)才在Virginia University成立,心理學家才有一個非正式的大規模的組織來應對這次可重復危機。COS搭建了開放科學框架的平臺(open science framework: osf.io/),開始組織全世界的心理學家進行聯合的大規模重復實驗。這一年,perspectives on psychological science再次組織特刊討論了可重復性以及一些實驗方法上的問題。這一期中,Lebel將PsychDisclosure.org推出,提出了研究者要完整報告自己研究的方法部分的要求。
2014年,關于重復實驗應該如何做,研究者們基本上有一些共識,許多雜志開始鼓勵提前注冊的重復實驗或者提前注冊。osf進一步完整,成為一個可以公開注冊研究和分享數據的平臺。Journal of Experimental Social Psychology上,發表了題為The Replication Recipe: What makes for a convincing replication?的文章。這一年,在social psychology這個雜志5月的一期中,也發表了一系列經過提前注冊過的重復研究,能夠重復原先實驗結果的并不多。不過一個比較積極的消息是,由Klein等人發表的多實驗室項目(ManyLab)中,對心理學中經典研究的重復,大部分是有結果的。Cumming 也在psychological science上發表了題為The New Statistics: Why and How的文章,指出需要在統計方法上進行變革。Psychological science也改變了其審稿的政策,對方法部分不再有字數的限制,開始啟用一些強制政策來加強方法部分的嚴謹性,如要求像Lebel指出的那樣報告方法部分四個方面的內容,使用效應量和置信區間等。其他的雜志也有一些相應的調整。
2015年,最大的事件就是COS于2013年組織的大規模重復實驗的結果得以發表,許多人期待的結果在Science上發表,其結論是對100項研究的重復,大約39%能夠重復出來(根據對重復的標準不同,這個比例有一點變化)。這個研究的結果有大量的數據在osf.io上共享,供研究者去挖掘,而確實也有不秒研究者利用這些數據進行了后續的分析。許多人以為,可重復危機基本上就已經確定了,心理學要開始進行艱苦卓絕的方法變革,來提高本領域研究的可重復性了。但是
2016年,Science上的一個評論再次引起爭議,Gilbert等人分析了COS大規模重復實驗的數據,認為三個方面的錯誤使得他們的不足以得到心理學研究的可重復率只有39%的結論。這一評論再次激起了媒體以及心理學家對可重復性的討論甚至是論戰。然而,這些評論與爭議,也無法改變另一個非常著名的心理學效應在重復實驗前的倒下:自我損耗(ego-depletion)的重復實驗也未能重復出其效應,而元分析也顯示了相似的結果。這個失敗讓籠罩在心理學家頭上的烏云更加密布,因為這個理論非常符合直覺,大量的心理學家投入時間和精力研究這個問題,大量的研究經費投入在這個問題的研究之中。不是一個人的問題,而是一群人的問題!
【可重復危機是如何形成的】相關文章:
如何請求對方重復或解釋06-27
英文寫作如何避免重復07-13
如何修改論文重復率10-01
漢字是如何形成與發展的?09-03
企業如何危機管理及危機溝通管理07-31
Excel如何避免重復輸入數據10-03
如何應對企業危機08-04
如何走出危機管理09-26
如何告別心理危機03-27