正态分布为什么最常见,什么情况是正态分布的单位,正态分布为什么最常见,什么情况是正态分布的单位

  正态分布为什么最常见,什么情况是正态分布的单位,正态分布为什么最常见,什么情况是正态分布的单位

  点击上面的“迅速的微笑学视觉”,选择添加“星标”或“置顶

  重货,第一时间送达。本文转自:机器学习算法,那些事

  在统计学中,正态分布是最常见的。身高、寿命、血压、考试成绩、测量误差等。男女比例都属于正态分布。

  以前我认为中间状态是事物的常态,过高过低都是少数,导致了正态分布的普遍性。最近看了约翰d库克的一篇文章,我意识到我的想法是错误的。

  正态分布为什么常见?真正原因是中心极限定理(central limit theorem)

  "几个独立统计量之和的平均值符合正态分布."

  上图中,随着统计数的增加,它们之和的平均值越来越符合正态分布。

  根据中心极限定理,如果一个事物受到很多因素的影响,不管每个因素的分布是怎样的,它们相加后,结果的平均值就是正态分布。

  比如人的身高,既有先天因素(基因),也有后天因素(营养)。每个因素对身高的影响是一个统计。无论这些统计量的分布是什么,它们之和的平均值都符合正态分布。(注:男女身高均呈正态分布,但男女混合身高不呈正态分布。)

  很多事情受很多因素的影响,导致了常见的正态分布。

  读到这里,读者可能马上会问一个问题:正态分布是对称的(高个子和矮个子的比例是一样的),但现实世界中很多分布是不对称的。

  例如,财富的分配是不对称的。zsdct的财富(可能比平均值高几万倍)远远超过了穷人的贫困(平均值的十分之一是极端贫困),即财富分布曲线右侧有一条长尾。相比较而言,身高的差异要小得多,最高和最矮的人与平均身高的差异都在30%以上。

  这是为什么呢?财富显然受到很多因素的影响。为什么不是正态分布?

  原来,正态分布只适合各种因素累加的情况,如果这些因素不是彼此独立的,会互相加强影响,那么就不是正态分布了。一个人能不能赚很多钱,是由很多因素决定的:

  家庭的

  教育

  运气

  工作

  .

  这些因素不是独立的,它们会相互加强。如果你出生在上流社会的家庭,你有更好的机会获得良好的教育,找到高薪的工作,遇到好的机会,反之亦然。也就是说,这不是1 1=2的效果,而是1 1 2。

  统计学家发现,如果各种因素对结果的影响不是相加的,而是相乘的,那么最后的结果就不是正态分布,而是对数正态分布,即x的log(x)满足正态分布。

  也就是说,财富的对数值满足正态分布。如果平均财富为1万元,那么1000元中在1万元之间(比平均值低一个数量级,宽度为9000元)的穷人和1万元到10万元之间(比平均值高一个数量级,宽度为9万元)的zsdct一样多。所以财富曲线左边幅度窄,右边长尾。

  下载1:OpenCV-Contrib扩展模块中文版教程

  在“迅速的微笑学视觉”微信官方账号后台,回复:扩展模块中文教程下载全网首个中文版OpenCV扩展模块教程,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等20多个章节。

  下载2:Python视觉实战项目52讲

  在“迅速的微笑学视觉”微信官方账号后台,回复:Python视觉实战项目下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别在内的31个视觉实用项目,帮助快校计算机视觉。

  下载3:OpenCV实战项目20讲

  在“迅速的微笑学视觉”微信官方账号后台,回复:OpenCV实战项目20讲,可以基于20下载20个OpenCV,实现OpenCV的高级学习。

  交换组

  欢迎加入读者微信官方账号,与同行交流。目前有SLAM、3D视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群。(以后会逐步细分)。请扫描以下微信号加群,并注明:“昵称学校/公司的研究方向”,例如:“jpdyf上海交大视觉SLAM”。请按格式备注,否则不能通过。添加成功后,会根据研究方向邀请你进入相关微信群。实战项目在群里发广告,不然就请你出群。谢谢理解~

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: