随机生成100个服从正态分布的随机数,python产生均匀分布的随机数

  随机生成100个服从正态分布的随机数,python产生均匀分布的随机数

  2018年10月12日

  正态分布在统计发展的历史中起着非常重要的作用,因为它允许不确定性和可变性的数学近似。

  虽然原始数据通常不符合正态分布,但误差通常符合正态分布,对于大规模样本的均值和总数也是如此。

  要将数据转换成Z得分,需要减去数据的平均值,再除以标准差。这样,生成的数据可以与正态分布进行比较。

  标准化:标准化(也叫归一化),通过减去平均值,再除以标准差,将所有变量放在同一个尺度上。这种方法避免了变量的原始度量尺度对模型的过度影响。

  一般我们称标准化值为Z-score。此时可以将测量值表示为“均值的标准差”,这样变量对模型的影响就不会受到原始变量规模的影响。

  画一条正态分布曲线

  # import toolkit import numpy as NP import matplotlib . py plot as PLT #绘图模块import scipy.stats as stats #该模块包含所有统计分析函数import matplotlib . style as style from ipython . core . display import html # PLOTTING CONFIG plot CONFIG plot configuration % mapplotlib inline style . use( fivethirtyeight )PLT . rcparams[ figure . figsize ]=(14,7) PLT .图(dpi=100) matplotlib图。图在0x1Bd827EC6D8 matplotlib。图。图在0x1Bd827EC6D8 # pdf概率密度函数plt.plot(np.linspace(-4,4,100),Stats.norm.pdf(NP。Linspace (-4,4,100)) # 100的数是从(-4,4)中随机选取的,概率密度函数PLT。Fill _ between (NP。画出了Linspace (-4,4,100),Stats.norm。Alpha=.15)#填充曲线内部#CDF累积概率密度函数PLT。剧情(NP。Linspace (-4,4,100),Stats。正常。CDF (NP。Linspace (-4,4,100)) # CDF函数表示前面概率累加的结果,-4 4是图例PLT.text (x=-1.5,y=0.7,s= PDF(规格化),rotation=.65,Weight= # 008 FD 5 )PLT . text(x=-0.4,y=) Weight= bold ,color= # FC4F30) # ticks坐标轴PLT。tick _ params (axis= both ,which= major ,label size=18) PLT。AXHLINE (Y=0,color= black ,线宽=1.3)

  #可以看出,pdf是一条均值为0,方差为1的标准正态分布曲线,符合这个事件的规律。

  累积概率密度函数。剧情(NP。Linspace (-4,4,100),Stats。正常。CDF (NP。Linspace (-4,4,100)) # CDF函数表示之前的概率累加结果,其中-4位为0,4位为1#LEGEND PLT。s=cdf ,旋转=.65,weight=bold ,color=#fc4f30 )文本(-0.4,0.5, cdf )

  均值#不同均值绘制的正态分布曲线形状也不同#默认情况下MU为0时的PDF,PLT.plot (np.linspace (-4,4,100),stats.norm.pdf(NP . Lin space(-4,4,100)) PLT.fill _ between (np .Stats.norm.pdf(NP . Lin space(-4,4,100))、alpha=. 15)# pdf PLT . plot(NP . Lin space(-4,4,100))、stats.norm.pdf(NP . Lin space(-4 Loc=2))PLT。FILL _ BETWEEN (NP。LINSPACE (-4,4,100),STATS。NORM.pdf(NP。LINSPACE (-4,4,100)),alpha=.15) # PDFMU=-2 PLT。plot stats.norm.pdf(np.linspace(-4,4,100),loc=-2))PLT . fill _ between(NP . Lin space(-4,4,100),stats . norm . pdf(NP . Lin space(-4,4,100)),Alpha=. 15)# LEGEND LEGEND PLT . text(x=-1,y=.35,s= $ \ mu=0 $ ,rotation=.65,alpha=.75,weight= bold ,color=rotation=.65,alpha=.75,weight=bold ,color=#fc4f30)plt.text(x=-3,y=.35,s=$ \mu=-2$ ,rotation=.65,alpha= bold ,weight= # e5ae 38 )# Ticks坐标轴PLT.tick _ params (axis= both ,which= major ,labelsize=18) PLT.axline (y=0,color= black ,线宽

  #当标准差不同时,正态分布曲线的形状也不同PLT。图(dpi=100)# PDF SIGMA=1 PLT。剧情(NP。Lin space(-4,4,100),stats.norm.pdf(np.linspace(-4,4,100),scale=1))PLT。fill _ between(NP。Lin space(-4,4,100),stats.norm.pdf(np.linspace(-4,4,100,scale=1),alpha=。15)# PDF SIGMA=1 PLT。剧情(NP。图例plt.text(x=-1,y=.35,s=$ \sigma=1$ ,rotation=.65,alpha=.75,weight=bold ,color=#008fd5)plt.text(x=2,y=.15,s=$ \sigma=2$ ,rotation=.65,alpha= 0.75,weight= # fc4f 30 )PLT .text(x=0,y=.6,s=$ \sigma坐标轴plt.tick_params(axis=both ,which=major ,labelsize=18)plt.axhline(y=0,color=black ,linewidth=1.3,alpha=。7)matplotlib。台词。0x1bd 8556 a 780处的2d线

  #只有标准差不同时,标准差越大,正态分布曲线越平缓,标准差越小,正态分布曲线越陡。

  获取正态分布的随机几个样本

  可以使用norm.rvs()其中默认均值=0,方差=1,也可以自己指定。

  来自scipy.stats导入规范#获得一个正态分布的随机样本print(norm.rvs(),end=\n\n) #获得10个正态分布的随机样本print(norm.rvs(size=10),end=\n\n) #自己指定均值和方差print(norm.rvs(loc=1,scale=0.1),end= \ n \ n )-0.8316623062885056[-0.02327842 0.624344293-1.095644424225 1.5419240094-0.679996 1.896概率密度函数(概率密度函数)导入numpy作为NP导入matplotlib。py绘图为PLT % matplotlib内联样式。使用( fivethirtyeight )PLT。rcparams[图。figsize ]=(14,7) **#随机变量x、Y的相对概率* * x=-1y=2 print( pdf(x)={ } \ npdf(y)={ } .格式(norm.pdf(x),norm。pdf(y)))pdf(x)=0.24197072451914337 pdf(y)=0.0539096651318806 #绘制连续的概率密度曲线x_s=np.linspace(-3,3,100)y _ s=norm。pdf(x _ s)PLT。散点(x _ s,y _ s)matplotlib。收藏。0x 1 BD 85 ACA 6a 0处的路径集合

  #标准差

  来自scipy.stats导入规范#X小于0.3的概率密度之和打印( P(x0.3)={} .格式(规范。CDF(0.3)))P(X 0.3)=0.6179114221889526 # X大于-0.2,小于0.2的概率密度之和print(P(-0.2x0.2)={} .格式(规范。CDF(0.2)-常模。CDF(-0.2)))P(-0.2x 0.2)=0.1585858878606

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: