查看更多
密码过期或已经不安全,请修改密码
修改密码壹生身份认证协议书
同意
拒绝
同意
拒绝
同意
不同意并跳过
来源:“小白学统计”微信公众号
最近看到一个别人发的微信,其实是几年前的一个新闻了,不过又有人翻出来发了,发了一下。我恰好看到,作为一名统计学家,我看过之后,真的觉得有种不吐不快的感觉。
这个新闻是说,调查了某省四千多名百岁老人的生活习惯,结果得出了令人震惊的结果:锻炼不重要,不锻炼才能活得久;饮食不重要,吃腌咸菜活得长。结论带着一副好像颠覆了人们常识的窃喜。我查了查新闻,据说好像这一调查报告当年还是大张旗鼓宣传,我却只想说,这种结论还能再荒谬点吗?!
如果我跟你说,有一种食物,得癌症的人99%(也可能是100%)的人都在吃,你敢不敢吃了?乍一听,估计你肯定要急着问:这是什么食物,以后再也不敢吃了。那我告诉你,这种食物叫做大米。为什么呢?我说的是实情啊,得癌症的那些人,我相信绝大多数都吃过大米(就连我这个整天吃馒头的北方人,偶尔也会吃一次大米的)。但是,你会相信我这个说法吗?你会以后连大米都不敢吃了吗?我想你不会,这是个普通人都知道的常识,可是,为什么还有人要说,“大多数百岁老人都不锻炼”这种谬论呢?
我们就以锻炼这一因素来说明。该调查报告发现,绝大多数人都不经常进行锻炼。由于没有看到具体百分数,暂且假定为70%吧。意思就是说,在4000名百岁老人中,有70%(2800)的人不经常锻炼(暂且不考虑所谓的“经常”是如何定义的)。这就能说明不经常锻炼的人活得久?这是一个典型的混淆“比例”和“率”的例子。
这里所谓的70%,只是一个比例,说明在所有的百岁老人中,有70%的人不经常锻炼,仅此而已。绝不能说,不经常锻炼的人活到百岁的几率更高。
假定该省有4000万人口,如果按“是否经常锻炼”将人群分为两类,假定这其中“不经常锻炼”的人占90%(3600万),“经常锻炼”的人占10%(400万),那就会形成下面所示的表格。
锻炼 | 百岁老人 | 非百岁老人 | 合计 | 百岁率 |
经常锻炼 | 1200 | 3998800 | 4000000 | 3/万 |
不经常锻炼 | 2800 | 35997200 | 36000000 | 0.78/万 |
合计 | 4000 | 39996000 | 40000000 | 1/万 |
从表中可以看出,在这种假定下,经常锻炼的人中,每万人会有3位百岁老人,而不经常锻炼的人中,每万人中只有不到1人的百岁老人。那到底是经常锻炼好还是不经常锻炼好呢?这个就更加一目了然。
可能有人说,说不定你的假设是错误的。不错,的确有这种可能,可能不是70%,可能是50%,但也可能是90%。除非你知道真实情况。
但这里只想说明的是,该调查报告根本不考虑“经常锻炼”和“不经常锻炼”的总人数,却只是在百岁老人的群体中说这两类人的比例,这是非常不科学的,完全混淆了比例和率。
比例(proportion)是一个静态的指标,说明的是在一个群体中,某种状态所占的百分比,如刚才例子中,百岁老人中不经常锻炼的比例、男性的比例、喜欢吃腌制品的比例,这些统统都是比例。
率(rate)则更像一个动态指标,一般发病率、死亡率等都是需要经过一段观察时间才能获得。如上述例子中,经常锻炼的人中有3/万的长寿率(暂且这么称呼吧),这就不是一个比例。经常锻炼或不经常锻炼的人,需要观察很久才能知道是不是能活到百岁。
所以有时候统计学不仅仅是科研人员需要掌握的内容,就算日常生活中也是需要了解一点的,否则很容易别人说什么就是什么。或者你可能觉得那里不对劲,但就是说不上来。当你了解一点统计学知识的时候,很多疑惑也许就迎刃而解了。
查看更多