你被骗过吗?7 种操纵数据的方式,第 7 种让无数人中招

数据统计和阐发是每个科研人员都应具备的技术,但愿本文能帮忙初学者避免无意中犯错,并让你在看到居心扭曲的统计成果时,第一时候识破作假者的手法。

撰文 | Winnifred Louis & Cassandra Chapman

翻译 | 杨晚钰

审校 | 夏烨

图片来历:Carlos Muza on Unsplash

统计可以或许有用地呈现数据,便于我们理解四周宿世界中的模式。但若是凭直觉诠释这些模式,成果凡是会令人掉望。以下是统计、概率和风险阐发中常见的几种错误,以及避免这些错误的方式。

01 | 无意义的差别

股市的良多日常波动都只是偶尔现象,并没有任何意义;在平易近意调查中,某党领先的一两个百分点凡是也只是数据噪声罢了(在给心猿意马的数据样本或公式中,呈现的难以诠释的转变或随机性)。

为避免对这种数据波动的原因作犯错误的推论,可以查看它们的“误差幅度”。差别若是在误差幅度内,则很可能无意义,这种转变很可能只是随机波动。

02 | 来自实际印象的误会

我们常会听到对两个群体差别的笼统归纳综合,例如说女性更乐于抚育儿女,而男性体格更强壮。这些结论凡是受到刻板印象和平易近间说法的影响,却轻忽了两个群体的相似之处,以及统一群体内部的差别。

若是随机遴选两个男性,他们的体能可能相差很大;若是随机遴选一男一女,他们抚育儿女的表示也可能很是附近,男性的表示甚至会更较着。

要避免这样的错误,你可以查看两组的“效应量”(effect size)。它可以反映两组间平均数的差别。若是效应量小,申明两组相似度高。但即便效应量大,也可能是较大的组内差别导致的,是以不克不及断心猿意马两组间的所有个别都存在差别。

03 | 忽略极值

考查对象从命正态分布(也称“钟形曲线”)时,效应量的两头是有主要意义的。在正态分布下,大大都个别接近平均值,只有一小部门个别远高于或远低于平均程度。

这种环境呈现时,组内的细小转变城市导致差别。这种差别对平均值几乎没有影响,但可能会完全改变极值的特征(见第二点)。

要避免这个错误,需要细心考虑是否要研究极值。若是针对平均程度进行研究,凡是不消在意组内的细微差别。但若很是存眷极值,这些细微差别将会影响庞大。

当研究对象从命正态分布时(在钟形曲线上),极值处的差别比平均值四周更为较着(表示在分布曲线上为:极值处的重叠区域较少,而平均值四周有大部门重叠)

04 | 相信巧合

美国每年淹死在泅水池里的人数和尼古拉斯·凯奇(Nicolas Cage)出演的片子数存在相关性,你知道吗?

若是你不雅察够细心,就会发现这种有趣的模式和相关性,但这也仅仅是巧合罢了。仅仅因为两件事同时发生转变,或者具有相似的转变趋向,并不克不及申明它们有关。

要避免这一错误,需要思虑不雅察到的相关性在多大水平上是靠得住的。这种相关性是一次性的,仍是多次呈现的?将来的相关性又可否展望?若是这种相关性只呈现了一次,那它很有可能是随机的成果。

05 | 因果倒置

举例来说,假如掉业和心理问题存在相关性,你很轻易注重到此中“较着”的因果关系——心理问题会导致掉业。但有时因果关系恰好相反,例如说是掉业诱发了心理问题。

要避免这一错误,可以在发现相关性时提醒本身思虑反标的目的因果关系。这种影响从相反偏向猜测可以当作立吗?仍是说两者彼此感化,形当作了一个环形反馈?

06 | 第三种身分

人们经常会健忘对可能的“第三身分”(也称外部身分)进行评估。某些环境下,两件工作的相关性是由第三身分引起的,它们现实上都是第三身分的成果。

举例来说,假设下饭馆和更健康的心血管系统间存在相关性,这会让我们相信两者间存在某种因果关系。然而成果可能是,能经常下饭馆的人社会地位更高,承担得起更好的医疗保健办事,而这种医疗保健办事才是他们心血管系统更健康的原因。

要避免这一错误,别忘了在发现相关性时考虑第三身分。找到事务 A 的可能的原因 B 时,反过来想一想,会不会是外部身分 C 导致了 B?C 会导致 A 和 B 同时发生吗?

07 | 点窜坐标轴

在对图表的纵坐标进行缩放和标注时,会呈现良多利诱人的处所。纵坐标刻度该当将统计对象有意义的数据规模完整地呈现出来。但有时,制图者为了强调细微差别和微弱的相关性,会缩小纵坐标的刻度规模。

从下图可以看出,当纵坐标刻度规模为 0~100 时,两个柱图看起来差不多高。但若将刻度规模设置为 52.5~56.5,它们看起来就判然不同了。

要避免这一错误,可以注重不雅察坐标轴刻度。对于那些没有刻度的图表,更要持思疑立场。

本文经授权转载自公家号“科研圈”,原文链接:https://www.sciencealert.com/the-seven-deadly-sins-of-statistical-misinterpretation-and-how-to-avoid-them

特 别 提 示

《返朴》,科学家领航的好科普。国际闻名物理学家文小刚与生物学家颜宁配合出任总编纂,与数十位分歧范畴一流学者构成的编委会一路,与你配合求索。存眷《返朴》介入更多会商。二次转载或合作请联系fanpusci@163.com。


  • 发表于 2019-09-18 02:01
  • 阅读 ( 944 )
  • 分类:其他类型

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
admin
admin

0 篇文章

作家榜 »

  1. xiaonan123 189 文章
  2. 汤依妹儿 97 文章
  3. luogf229 46 文章
  4. jy02406749 45 文章
  5. 小凡 34 文章
  6. Daisy萌 32 文章
  7. 我的QQ3117863681 24 文章
  8. 华志健 23 文章

联系我们:uytrv@hotmail.com 问答工具