2019年7月,克里斯托弗·弗格森(Christopher Ferguson)在Quillette颁发了一篇关于心理学尝试反复危机的文章。心理学作为一门科学在成长过程中浮现出了很多难题,作为理论心理学家,我很赏识他对一些难题清楚而简明的会商,包罗学术颁发成见,以及媒体对弱影响身分的大举衬着。我认为,现今有一种不太为人所知的“疾病”正困扰着心理学及相关学科(包罗保健科学、家系研究、社会学和教育研究):相关性和因果关系的混合。而比来的研究表白,“祸首祸首”并不是一般公众和媒体,而是科研工作者们自己。
相关性和因果关系
我们可能都听过“相关性不是因果关系”这样的老生常谈。担保一个变量“导致”(causes)另一个变量发生转变有三大准则,相关性只是此中第一条。
—Diablo Magazine
为了表白一个变量导致另一个变量发生转变,起首要知足第一准则,即证实两个变量是共变的:其一增加,另一变量亦趋势于增加(此为正相关;举例,在SAT测验中获得高分的学生在大学里也倾标的目的于获得相对较高的GPA);其一增加,另一变量趋势于下降(此为负相关;例,更喜好在工作中和人打交道的学生,不太可能本家儿修计较机科学和物理等无机学科)。
第二大准则为时序优先性:假心猿意马原因(The presumed cause)必需先于假心猿意马效力呈现。例,儿童期间被暴打屁股的人在青少年智商测试中往往得分较低。关于时序优先性的描述往往会激发因果关系的解读。例如,在打屁股和智商的情境中,有人会理所当然地揣度出被揍“导致”了低智商。要揣度因果关系,时序优先性需要但不充实。正如史蒂芬·平克(Steven Pinker)在《白板》(The Blank Slate)一书中写道,假如你在睡前心猿意马好了两个闹钟,一个闹钟6点响,另一个闹钟6点15分响,跟着第一个闹钟在第二个闹钟之前准时唤醒了你,你会较着感触感染到系统性共变和时序优先性,可是这并不料味着第一个闹钟响“导致”了第二个闹钟响。同理,儿童期间被打屁股早于青少年智商测试,但这并不克不及证实打屁股“导致”低智商。接种疫苗会导致自闭症是个早已被完全证伪的谣言,这一可怜的信念似乎源于由时序优先性揣度出因果关系的倾标的目的:因为接种疫苗要早于自闭症症状的闪现,人们随即会错误地假设是疫苗“导致”了自闭症。如果真的按这种逻辑推理,那么在孩子蹒跚学步时代,任何事物都可所以自闭症的诱因。
第三大准则也是最主要的一条:要揣度因果关系,研究者们必需处置潜在的稠浊变量(confounding variables),即能以别的一种体例诠释假心猿意马因果联系的假心猿意马原因。以打屁股与智商的研究为例,研究者可以考虑到各类各样潜在的(且非互斥的)稠浊身分:糊口压力大,物质前提贫苦可能会导致体罚和认知能力发育迟缓两种环境;怙恃的低智商可能会导致体罚和孩子低智商得分;儿童期间的低智商得分可能会导致体罚和芳华期的低智商得分,诸如斯类......要让特心猿意马原因(如打屁股)当作立,必需将原因隔离,然后经由过程随机分派施加于此中部门个别(或者说原因的分歧条理必需施加于分歧群体中的个别)。一般来说,这是经由过程尝试设计来实现的,尝试设计包罗对假心猿意马原因的“把持”,然后对展望中会受到把持影响的变量进行测量。
没有伦理研究者会想要随机分派怙恃对孩子进行分歧水平的体罚,以评估其对儿童智商的自力影响。可是别的一些关于人类的难题“有望”经由过程尝试解决。例如,游玩暴力血腥电子游戏会增添玩家进犯性。研究者要验证这个设想,他们会在尝试设计中随机放置被试个别玩一段时候暴力电子游戏,另一组被试会被放置玩差不多刺激,可是非暴力的游戏;在施加了把持后,研究者会测量被试个别的进犯性。
—Kata
在受控尝试中——研究者把持一个具体的原因变量,随机分派被试履历把持变量的分歧条理,将其他身分连结恒心猿意马,然后客不雅地测量把持的影响——这是文献撰写中探讨因果关系的“黄金准则”。要注重,一个变量对另一个变量有因果影响并不料味着它“决议”了另一个变量。在暴力电子游戏和进犯性的例子中,或许有证据表白接触暴力游戏会让人在短期内发生进犯性设法,可是接触暴力游戏并不克不及“决议”一小我的暴力水平;这只是影响进犯性的浩繁变量之一。
或许你能明白熟悉到相关性和因果关系之间的区别。那你是幸运的少数。关于逻辑思维和思维成见的册本经常切磋将相关性和因果关系混为一谈的趋向,例如基思·斯坦诺维奇(Keith Stanovich)的《超越智商》(What Intelligence Tests Miss)和迈克尔·舍默(Michael Shermer)的《为什么人们会相信怪事》(Why People Believe Weird Things)。
几年前,我和我的学生颁发了一系列研究,证实了无论人们的教育水平若何,把相关性和因果关系混合的趋向老是存在的。以此中一项研究为例,我们给社区里的一构成年人阅读了一则虚构的研究简介,描述的是一项学生自负和学业表示的相关性研究,研究中的两个变量都被测量(不雅测)而且两者都没有被把持;对于另一组被试,我们虚构的研究简介描述了一项对学生自负进行节制的尝试性研究(即随机分派一些学生收到促进自负的讯息,另一些学生则没有),然后对学生的进修成就进行测量。两组被试知悉的研究结论都声称:该研究揭示了自负心与进修成就的正相关关系。随后,我们扣问被试,可以从研究发现中揣度出什么?
自负会“导致学业的当作功”——固然阅读了相关性研究的被试不该该揣度出这样的结论,可是两组被试得出该结论的比例不异。此外,在阅读了相关性研究的被试中,无论他们的受教育水平若何,他们做犯错误因果揣度的可能性相差无几!(趁便提一下,自负提高学业成就的推论现实上与最新科学研究相违反,该研究很清晰地表白,即便自负与学业当作功有因果关系,那也是学业当作功先于自负,而不是相反!)
因果关系的说话
在英语说话中,描述因果关系的体例远多于描述非因果关系的体例,这也许正彰显了人类揣度因果关系的偏好。我和同事们细心阅读了数百篇心理学期刊文章,发现了跨越100个分歧的词汇和短语被用于暗示因果关系。如下面的关头词云图所示,大字体暗示此中最常用的。
暗示因果关系的关头词云图 —图片来历:作者供给
说话中可能有当作百上千种体例来暗示因果关系,这很主要,因为人们确实弄不清说话中真正的“因果关系”,人们也不知道(如前文描述)在何种情境下利用因果关系的说话是得当的。是以,若是没有充沛证据,就利用因果说话来描述研究成果,读者很可能无法意识到说话上的细微误差,从而被误导而不自知。
学者们几回再三求全谴责媒体,怪罪其利用因果说话不妥。2016年,来自Vox的布莱恩·雷斯尼克(Brian Resnick)标的目的很多闻名的心理学家和社会科学家发问:记者在报道科学研究、撰写文章时犯了什么错?在获得的回答中,相关性和因果关系的混合位居榜首。诚然,媒体报道中充溢着不得当的因果关系揣度。几乎在任何新闻网站随便一搜,你都可以看到像这样的题目《学生喝酒若何影响GPA》、《朴拙的微笑有助于长命》还有《收集凌辱导致青少年睡眠质量和抑郁症状恶化》,记者基于这些测心猿意马变量的“非因果”(相关性)研究编写的如上题目,都属于因果关系断言。
—Kata
不外,比来有几项研究指出,因果关系说话的滥用始于科研工作者本身。例如,在医学范畴,一项大规模的文献调查表白,有对折以上的相关性研究文章包含了对研究当作果的因果解读。在教育范畴,一篇颁发在讲授期刊上的文献调查表白,有跨越三分之一的相关性研究文章包含了因果关系陈述。在心理学范畴,我和我的同事进行了两项研究,凸起表白了该问题的遍及性。起首,我们核阅了一系列随机的摘要样本,这些摘要的展示海报已被首屈一指的心理学专业组织——心理科学协会(APS)审核经由过程,并在其年会上展示。我们很掉望地发现,跨越一半的摘要在没有充沛证据的环境下利用了因果说话(即,所涉及的研究是相关性的)。当然,海报展示的严谨水平要比正式演讲或期刊文章低,是以在后续研究中,我们核阅了心理学11家知名期刊中的660篇文章。我们的研究成果反复证实了:对折以上利用了因果说话描述的研究文献现实上是相关性研究;换句话说,其因果说话的利用是不得当的。
我把我们的阐发陈述提交给了心理科学协会旗下的一家杂志,杂志编纂却退回了我们的投稿,并答复说:人类将相关性与因果关系混为一谈的倾标的目的已经众所周知。行呗,也许这确是众所周知的成见,但若是在心理学最热点的专业会议之一里,这种成见在其海报展示中泛滥,而且在心理学的知名期刊中同样遍及,那么很显然工作就大条了。(应另一家期刊编纂邀请,我们已将此研究当作果颁发在了他们的期刊上。)
忽略了稠浊身分
我们在应对社会中的问题时,混合了概念并错误地从相关性数据中揣度出因果关系,这阻碍了最有用解决方案的拟定。例如,考虑到幼儿在早期说话习得和将来学业成就方面的庞大差别。哈特和里斯利(Hart & Risley)1995年的追踪研究是儿童早期成长和教育中最常被引用的研究之一,该研究表白,在社会经济状况较差的家庭中长大的孩子,怙恃对他们说的话要比社会经济状况较好的家庭少得多,而且研究展望认为这些早期的说话经验差别,会造当作孩子将来在词汇量和学业成就方面的差别。
“怙恃给后代供给的言语情况是影响后代言语成长的一个关头身分”,因为这一因果关系的解读,催生出很多昂贵的强化课程,这些课程传授并助力怙恃与孩子之间的言语互动。然而,哈特和里斯利的研究数据是相关性的。即,该研究并没有节制亲子之间言语互动的数目与质量;该研究没有随机分派家长供给一种形式的说话体验,另一些家长供给另一种形式的说话体验,然后再测心猿意马因为把持导致的儿童成长转变。因为一些相关变量会大大增添来自怙恃的言语互动和儿童言语能力,要指出早期说话体验的差别“会导致”儿童词汇量和学业成就的差别,就必需要消弭稠浊身分。
配合的遗传性质也是潜在的稠浊身分。社会经济状况好的怙恃比社会经济状况差的怙恃有更高的认知能力,社会经济状况和认知能力都是可担当的(heritable)。是以,对于怙恃供给的说话体验质量和儿童的言语能力,基因可能是造当作影响的第三个变量。为了验证这一可能性,行为遗传学家充实操纵“天然尝试”,一些儿童由其亲生怙恃扶养(共享基因和情况前提),一些儿童由养怙恃扶养(仅共享情况前提)。在典型的家庭中(如哈特和里斯利研究中的家庭),孩子和怙恃的相似水平若何,在哪些方面共享基因和养育情况?在收养家庭中,孩子和怙恃的相似水平若何,在哪些方面共享养育情况?
—AD Marcy Atarod
事实上,这些问题的谜底在20宿世纪20年月就有研究,并有无数研究人员在多种情境下反复尝试:在亲生家庭中,孩子的词汇量和言语能力与怙恃相似;而在收养家庭中并非如斯。
其关头意义在于,在哈特和里斯利的研究中,怙恃的言语行为与其后代的言语能力之间存在联系,但这并不足以揣度出怙恃的言语行为会“影响”后代的言语能力。
用遗传学来诠释此种联系关系更妥,因为这种联系关系只有在怙恃和孩子有亲缘关系的时辰才会闪现出来。
换一种说法,研究成果表白,为后代供给高质量说话体验的怙恃类型与供给低质量体验的怙恃类型存在系统性差别;能从怙恃那边获取高质量言语反映的后代,与难以获取高质量言语反映的后代也存在系统性差别。因为成长心理学家和教育工作者继续将哈特和里斯利的相关数据,解读为早期说话经验对言语能力因果影响的证据,是以他们继续推进干涉干与办法;若是不认可并考虑到情况及遗传身分,最终这些干涉干与办法的结果可能会打扣头。
混合相关性和因果关系可能在另一个范畴误导人们,这个范畴就是“微冲犯”(microaggression)。在推广该术语的文章中,“微冲犯”被界说为“日常言语、行为或情况中简短和常见的欺侮,无论是有意仍是无意的,城市传达对有色人种的敌意、贬低或负面种族歧视和欺侮。”
—Kata
这个术语最初是在种族和平易近族语境下利用的,但此刻应用得更普遍了。一项关头的相关性研究发现,若是个别自我陈述蒙受到“微冲犯”,那么就相对更有可能被心理健康问题侵扰。该研究的数据是“相关性的”,可是却被人们解读为因果关系:即,被“微冲犯”导致心理健康问题。正因为如斯,单元要求员工进行用语、用词和行为培训,以规避所谓的“微冲犯”,现今这种环境在学术界和商界很常见。我并不是说受到“微冲犯”不会对小我健康造当作现实损害;这种探讨因果关系的体例看似是合理的,可是若是没有真正的尝试研究对某些个别施加“微冲犯”并另设组对照,随后对预心猿意马的成果进行测量,则因果揣度是“无法当作立”的。否则,无异于信口开河。
斯科特·利林菲尔德(Scott Lilienfeld)在文章中呼吁对“微冲犯”进行更为严谨的研究,并指出消极情感性(神经质)的人格特质是一个显著的稠浊身分:消极情感性的敏感个别出格轻易认为本身遭到“微冲犯”,而且消极情感性的敏感个别更易蒙受心理健康问题的侵袭。因为“微冲犯”没有切确的界说,而是完全按照听者的解读来界说的,那么感应“微冲犯”和心理健康问题都有可能与消极情感性有关。我认为,“微冲犯”导致心理健康问题的因果揣度会让人做出不妥的假设,在这些证据不充实的假设驱动下,杜绝“微冲犯”的研习勾当可能会带来事与愿违的成果,让敏感个别变得加倍敏感。
事实上,在我和同事们客岁开展的一项研究中,我们起首奉告大学生被试这样的话语:“人们聊天说地,但有时辰他们的无意之言会危险到你”,比拟消极情感性指数较低的学生,消极情感性指数较高的学生给诸如“你应该跑跑步了(You should take up running)”这样的含混陈述打上了更高的“有害”评分。正如卢基亚诺夫(Lukianoff)和海德特(Haidt)在《美国人心灵的宠嬖》(The Coddling of the American Mind)一书中所本家儿张,关于“微冲犯”的培训可能无法促进人们恭顺地彼此接触(即便其愿景很夸姣),却给人话里挑刺的机遇。
心理学界能做得更好
对于由相关性揣度出因果关系的这种倾标的目的,我但愿心理学家们可以或许联袂降服,就像心理学家回应心理学尝试反复危机那时一样,本身负起责任来,实施加倍严谨的研究和数据阐发。若何降服这种倾标的目的取决于其呈现的原由、体例、时候及对象。心理学家可能和其他人一样,难以区分相关性和因果关系;若是是这样的话,我们就需要完美我们的科学培训,增添更多针对性练习,以准确表达因果关系、规范证实因果关系。
—Davide Bonazzi
另一种可能性:或许是因为意识形态差别和利己本家儿义成见,心理学家在审校其他人的研究时可以觉察不妥的因果揣度,但却会在本身的研究中忽略其存在。若是是这样的话,我们就需要鼓动勉励质疑的声音,把相关性和因果关系的矛盾摆到台面上来,以便对彼此的研究进行扶植性的核阅。也可能是科研工作者们居心利用不妥的因果说话,让其研究获得更多存眷。还好,比来的研究表白,科研人员大可不必如斯“操作”,因为新闻机构在遴选科研新闻稿时,利用非因果说话和利用因果性说话的文章被选中的几率大致不异。
无论若何,这取决于心理学家们是否能把控好彼此,以达到更高尺度:(1)实时辨识出因果性陈述;(2)在做出因果性陈述之前,确认研究过程是否知足三大准则。在科学追求真理的过程中,心理学必需做得更好。
翻译:邮狸 审校:西子 编纂:语月 封面:Jeff Csatari
出格提醒:
对内容感乐趣的伴侣可以存眷公家号:神经实际。神经实际是一家专注于认知科学、神经科学、精力病学等前沿报道和深度解读的科学传布组织。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!