贺岁片——从三个故事认识统计描述

  新年就要到了,可能部分朋友已经回到家里团聚,还有部分朋友坚守在工作一线,本号的小编一起给大家拜个早年,祝大家新年快乐,阖家欢乐。

  让我们先来分析一下剧情的关键,我们为什么要增加护甲?!增加护甲的目的是不让飞机掉下来。在这里面,弹孔、护甲之间是什么关系呢?我们认为关键部位的“弹孔”是原因,对应的结果是“坠机”。这么看来,在关键部位增加护甲就是一种针对病因的干预措施了。我们希望探索病因,也就是寻找导致坠机的关键弹孔,而我们现在只有条件做回顾性的研究。理想的情况是,我们能找到所有发生坠机的飞机,和所有飞回来的飞机。比较他们身上各部位弹孔的差异,弹孔密度存在差异,且坠机飞机弹孔更多的部位,自然是坠机的“病因”(关键弹孔)了。但是,别忘了,坠机的飞机我们没处找啊。所以,统计学家面对所有存活的飞机,想象了一个情况出来。他们认为所有飞机(包括坠机和飞回来的飞机)各部分弹孔的密度应该是相同的,也就是飞机每个部分的中弹机会差不多。我们没有坠机的飞机,所以我们只能看飞回来的飞机。在飞回来的飞机中,弹孔较少的,很有可能就是坠机飞机中弹较多的,这个在两组飞机间就有可能存在差异。当然,实际上飞机并不是各部位中弹的概率都一样,就想我下雨,我们永远不会直接淋湿腋下一样。但是如果我们把所有飞回来飞机中弹少的部分都加护甲,自然会包括致命部分,也就必然能减少坠机。

  总之,将现在数据总结并用统计方法描述其分布规律是极其重要的工作,也是各种决策中最重要、有力的,因此大样本的调查文章虽然只有简单的统计描述往往可以发到最好的上。

  统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2,…,N,这是一个十分古板的传统,正是因为这个传统,德军送给了盟军统计学家需要的数据。盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计N,也就是德军的坦克总量。其实就是求均匀分布的边界,公式是:(1+1/缴获坦克总数)*缴获坦克的最大编号。

  如果把所有坦克作为一个“总体”的话,抓坦克其实就是一个“抽样”的过程。我们认为坦克在战场上被是一个随机事件的话,那么我们通过抓坦克得到的“被缴获坦克”就是总体的一个随机样本。好吧,那其实我们要做的事情很简单,就是从被缴获的这个随机样本,推断总体的大致情况。

  根据已有的数据进行描述并总结规律,这些规律可以用到相同分布的数据上,如上述例子中知道是均匀分布可以推断分布边界。比如知道年龄是正态分布,均值是35岁,标准是10岁,那么根据正态分布规律,超过55岁

手机正文底部

您可以还会对下面的文章感兴趣:

  • 科学家发明细胞高速识别技术
  • 助人体吸收铁 新研究找到大肠杆菌“益处”
  • 研究称喝酒无论多少都对健康有害
  • 抽血可提前5年预测肾癌
  • 5-HT系统介导肝脏2型糖尿病相关的病理改变
  • 最新评论