浅出深入统计学(二)

发布时间:2016-12-10 20:59:07 编辑:www.fx114.net 分享查询网我要评论
本篇文章主要介绍了"浅出深入统计学(二)",主要涉及到浅出深入统计学(二)方面的内容,对于浅出深入统计学(二)感兴趣的同学可以参考一下。

推翻或者制造“谣言”     人是一种相信直觉和传统的高智商“动物”。而建立在大量数据上利用严谨数理公式得出统计学结论常常让人大吃一惊(上文已经吃过一次了)。人们的直觉是:友谊是双向的,所以我们认为整个数据应该会平均分布开来:任何一个人的朋友数和他的朋友相比应该是差不多的。但是统计学却向你证明:自己的朋友数几乎总是小于自己所有的朋友的平均值。我们可以看个不寻常的统计学案例:                                                                                        图1   8个女孩的朋友关系图     如上图所示,其中标注了每个人的名字,朋友数以及朋友的平均朋友数(括号中)。可以发现只有Sue和Alice的朋友比其朋友的朋友多。对括号中的数取平均,结果为2.98,而这八个人的平均朋友数为2.5(10条关系*2/8)。群体中所有朋友的朋友平均数大于群体所有人朋友平均数,这看起来很不可思议。根据数理推断,我们得出:朋友的朋友均数=朋友均数+朋友数方差/朋友均数。如果你的朋友中存在交际明星,如Sue和Alice,则会产生上述结果。而心理学家Satoshi Kanazawa也指出:你更有可能和朋友多的人交朋友,而不是那些朋友少的人,所以,这几乎是现实中违背我们直觉的实情了。     当然,就如原文最后一章指出统计也可能出错一样,如果数据或者使用的方法不好,它也可能是“谣言”的温床。当然,这些“谣言”有可能是故意制造或者无心之失。     从数据来说,我们一般得出的数据大多是观测数据,实验数据实施的要求有时太苛刻以至于我们无法得到。观测值=真值+非统计错误+随机性,数据的收集隐藏着很多令统计结果偏颇的危机。从方法论来说,不适宜的分析方法、误用的统计推断以及错误的数字解释,这些都会成为统计结果错误的推手。     以上这些就要求我们如果要得出比较正确的推论,好的收集方法加上合适的分析方法必不可少。原文并没有过多的谈到收集数据的方法,着重在分析方法上,但是收集好的数据真的是一门学问,牵扯到了许多工程方法,社会学等。     这难道意味着正确的数据与方法就能得出正确的结论么?     有一种情况恰恰是:正确的“统计”,荒谬的结论。如下面的例子:     统计资料表明.大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?     实际上,由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。现实中很多的统计对变量之间的关系是否存在因果关系没有做出很严格的论证(就因果关系本身,也是一件令人争论不休的问题)。也因此,大量的统计数据被用做误导大众的标语,以此获得商业利益或者其他利益。 《统计学》的教育尝试     最后回归到这本书本身除了“统计学”本身以外的收获。正文没有公式,通篇是例子的确是比满眼看不懂的冰冷公式来的更人性化与可爱。同样的,它也做到了一个很重要的一点:公式的产生往往在应用需求之后,概念之后,然而我们一般的学习,却从公式开始,再到例子,应用,然而这本书还原了本来的顺序,从例子入手,让人理解这些为何要用这些公式,这显然更适合大众。统计是一门每个人都应当了解的学科,因为它应用的如此广泛,只有了解了,才能辨别很多误导性很强的结论。     但是,这门书是如从冗长以至于让人几欲丢弃。如果这本书仅仅是教材,学生会在教师的诱导下而学习,可是这样的模式不适用于大众,更精练的故事,更薄的书会好点。     总而言之,这样的模式还是值得尝试的,那些需要普及的知识就应该如此浅显的令人读懂。举个例子而言,比如金融的基本知识,门外汉面对公式密布,不知所云的金融书唯有冷汗涔涔,如果能像这本书一般,以一个个例子来解释各个基本概念,我相信这样的书更适合大众。

上一篇:工欲善其事,必先利其器——HttpStatus Enumeration
下一篇:九度OJ 1209 最小邮票数 -- 动态规划

相关文章

相关评论