python绘制正态分布函数曲线,正态分布函数python
1.概率论数理统计中常用统计量的Python实现综述
1.求数学期望
#编码=utf-8
进口数量
arr=[1,2,3,4,5,6]
#1、数学期望(俗称平均值)
num_avg=np .均值(arr)
打印(数量平均值)
2.求方差和标准差
#编码=utf-8
进口数量
arr=[1,2,3,4,5,6]
#查找差异
num_var=np.var(数组)
打印(数量变量)
#找出标准偏差
num_std=np.std(arr,ddof=1)
打印(数字_标准)
3.寻找协方差
#编码=utf-8
进口数量
#查找协方差
x=np.array([[1,2,3],
[2 ,5 ,6 ],
[ 7 ,8 ,9],
[ 11 ,11 ,12]])
cov_xy=np.cov(x)
打印(cov_xy)
二、相关系数的Python实现概要
1.公式法
#编码=utf-8
进口货币
进口熊猫
X=[1,2,3,4,5]
Y=[1.01,2.02,3.03,4.04,5.05]
#平均值
XMean=numpy.mean(X)
YMean=numpy.mean(Y)
#标准偏差
XSD=numpy.std(X)
YSD=numpy.std(Y)
#z得分
ZX=(X-XMean)/XSD
ZY=(Y-YMean)/YSD#相关系数
r=numpy.sum(ZX*ZY)/(len(X))
打印(r)
2.用numpy的corrcoef法计算相关系数。
#编码=utf-8
进口货币
X=[10.11,20.11,33.11]
Y=[10.22,20.22,30.22 ]
t=numpy.corrcoef(X,Y)
印刷(吨)
3.用熊猫的corr法计算相关系数。
#编码=utf-8
进口货币
进口熊猫
X=[10.11,20.11,33.11]
Y=[10.22,20.22,30.22 ]
数据=熊猫。DataFrame({X:X, Y:Y})
t2=data.corr()
打印(t2)
三。常见分布式Python实现概述
1.郑泰分布
正态分布是一个连续分布,它的函数可以取在实线上的任何地方。正态分布由两个参数描述:分布的均值和方差2。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
mu=0 #均值
西格玛=1 #标准偏差
x=np.arange(-3,3,0.1)
打印(x)
y=stats.norm.pdf(x,0,1)
打印(y)
plt.plot(x,y)
plt.title(正常:$ \管理部门$=%.1f,$\sigma^2$=%.1f%(管理部门,西格玛))
plt.xlabel(x )
plt.ylabel(概率密度,fontsize=15)
plt.show()
2.指数分布
指数分布是一种连续的概率分布,用来表示独立随机事件的时间间隔。比如乘客进入机场的时间间隔,给客服中心打电话的时间间隔,中文维基百科新条目的时间间隔等等。
我设置参数为0.2,x的取值范围为$[1,10]$。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
=0.2
x=np.arange(1,10,0.1)
y=lambd * np.exp(-lambd *x)
打印(y)
plt.plot(x,y)
plt.title(指数:$\lambda$=%.2f% (lambd))
plt.xlabel(x )
plt.ylabel(概率密度,fontsize=15)
plt.show()
3.二项分布
射手射击时,射击成绩分为命中目标和脱靶两种。如果每次射击都是独立的,击中目标的概率都是0.7。讨论四次射击中恰好两次击中目标的概率(0.2646)。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
P=0.7 #事件A的概率是0.7
N=4 #重复实验4次。
k=NP . arange(n-1)# 5可能的结果(0,1,2,3,4)
r=stats.binom.pmf(k,n,p)
打印(r)
4.泊松分布
服从泊松分布的随机变量x,用速率参数)表示固定时间间隔内的事件数。参数告诉你这个事件的发生率。随机变量x的均值和方差为。
E(X)=,Var(X)=
泊松分布的例子:已知一个路口的事故率是每天2次,那么这里一天发生4次事故的概率是多少?
让我们考虑一下这个平均每天发生两起事故的例子。泊松分布的实现有点类似于二项式分布。在泊松分布中,我们需要指定比率参数。泊松分布的输出是一个序列,包含0,1,2,最多10个事故的概率。我用结果生成了下面的图片。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
比率=2
n=np.arange(0,10)
y=stats.poisson.pmf(n,rate)
打印(y)
plt.plot(n,y, o-)
PLT . title( Poisson:rate=% I %(rate),fontsize=15)
plt.xlabel(“事故数量”)
plt.ylabel(数字事故概率,fontsize=15)
plt.show()
5.t 分布
t分布形状类似于标准正态分布;t分布是对称的,比正态分布具有更强的分散性,其密度曲线比标准正态分布更平坦。
(1)t分布的应用场景:
-按照小样本估计正态分布且方差未知的总体的均值。
-对于任何样本量,真实的平均抽样分布都是t分布,因此当有疑问时,应使用t分布。
-当样本大小在30-35之间时,t分布与标准正态分布无法区分。
-当样本量达到120时,t分布实际上与标准正态分布完全相同。
-
(2)自由度df对分布的影响
-样本方差使用的是一个估计参数(平均值),所以计算置信区间时使用的t分布的自由度是n-1。
-由于引入了附加参数(自由度df),t分布的方差大于标准正态分布的方差(置信区间更宽)
-与标准正态分布曲线相比,自由度df越小,T分布曲线越平坦,曲线中部越低,曲线两侧尾部翘得越高。
-自由度df越大,t分布曲线越接近正态分布曲线。当自由度df=时,t分布曲线为标准正态分布曲线。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
不同自由度学生的# T分布和标准正态分布
进口数量
fromscipy.stats importnorm
fromscipy.stats导入
importmatplotlib.pyplot asplt
打印(“比较t分布和标准正态分布”)
x=np.linspace( -3,3,100)
plt.plot(x,t.pdf(x,1),label=df=1 )
plt.plot(x,t.pdf(x,2),label=df=20 )
plt.plot(x,t.pdf(x,100),label=df=100 )
plt.plot( x[:5],norm.pdf(x[:5]), kx ,label=normal )
plt .图例()
plt.show()
6、贝塔分布(Beta Distribution)
分布是取值在[0,1]之间的连续分布,用两个形态参数和的值来表征。
分布的形状取决于和的值。贝塔分布广泛应用于贝叶斯分析。
#编码=utf-8
进口数量
fromscipy importstats
importmatplotlib.pyplot asplt
a=0.5
b=0.5
x=np.arange(0.01,1,0.01)
y=stats.norm.pdf(x,a,b)
打印(y)
plt.plot(x,y)
plt.title(Beta: a=%.1f,b=%.1f% (a,b))
plt.xlabel(x )
plt.ylabel(概率密度,fontsize=15)
plt.show()
亲爱的读者:如果你觉得关注、收藏、喜欢这么麻烦,谢谢!
055-79000的用途
1.让大数据和人工智能的专业数学:概率数理统计、线性代数、决策论、最优化理论、博弈论等数学模型通俗易懂。
2.让大数据与人工智能专业涉及的数据结构和算法:分类、聚类、回归算法、概率等算法通俗易懂。
3.最新高科技趋势:数据采集中的智能传感器技术:医疗大数据智能决策分析;物联网智慧城市等等。
根据初学者的需求,目前主流的计算机语言有C语言、Java语言、Python语言、Scala函数等。
根据读者需求,有浅显易懂的人工智能相关的计算机科学与技术、电子技术、芯片技术等基础学科的文章。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。