python统计量分析,python数据统计常用方法
# -*-编码:utf-8 -*- 创建于2017年6月27日星期二09:19:25 @作者:云金奇E-mail:yunjinqi@qq.com让自己在这个世界上与众不同将熊猫作为螺纹中径导入scipy.stats作为舰对岸(ship to shore)导入数组作为np#葛洲坝df=PD。read _ excel( C:/Users/HXWD/Desktop/600068。xlsx’)df。head()# # # # # # # # # # # #计算数据的基本统计量:均值,方差,偏度,峰度等index=list(df。columns)stock 068=[]for I in range(1,4): scores=np.array(df.ix[:i]) pe=df.ix[:i].describe() pe.name=葛洲坝索引[我]打印(pe) pe[偏度]=sts.skew(分数)pe[峰度]=STS。xsdjdosis(分数)股票068。追加(PE)股票068=PD .数据帧(股票068).Tprint (stock068)#海澜之家df=PD。read _ excel( C:/Users/HXWD/Desktop/600398。xlsx’)df。head()# # # # # # # # # # # #计算数据的基本统计量:均值,方差,偏度,峰度等index=list(df。columns)stock 398=[]for I in range(1,4): scores=np.array(df.ix[:i]) pe=df.ix[:i].describe() pe.name=海澜之家索引[我]打印(pe) pe[偏度]=sts.skew(分数)pe[峰度]=STS。xsdjdosis(分数)股票398。追加(PE)股票398=PD .数据帧(股票398).t打印(库存398)#数据=PD。concat([stock 068,stock398],axis=1,join _ axes=[data。index])数据=股票068。加入(股票398)打印(数据)数据。to _ CSV(统计. csv) #常用统计量的计算
#2018.01.16重新回来看峰度的计算,发现sts.xsdjdosis(),df.xsdjd()两个计算均存在某些问题,与上机指导的描述性统计结果不一致,可能是计算口径不同。借用一篇别人编写纯代码计算的公式,得到了和上机指导一样的结果,代码如下
导入mathdef calc(data):n=len(data)牛=0.0牛2=0.0牛3=0.0对于单数据:牛=阿牛2=阿**2牛3=阿**3牛/=n #这是求E(X) niu2 /=n #这是E(X^2) niu3 /=n #这是E(X^3) sigma=math.sqrt(牛2 -牛*牛)#这是D(X)的开方,标准差返回[牛,西格玛,牛3] #返回[英(X),标准差,E(X^3)]def calc_stat(data): [niu,sigma,Niu 3]=calc(data)n=len(data)Niu 4=0.0 for a in data:a-=Niu Niu 4=a * * 4 Niu 4/=n skew=(Niu 3-3 * Niu * sigma * * 2-Niu * * 3)/(sigma * * 3)xsd JD=Niu 4/(sigma * * 4)return[Niu,sigma,skew,xsdjd] #返回了均值,标准差,偏度,峰度建议计算峰度的程序使用下面的代码
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。