python统计量分析,python数据统计常用方法

　　# -*-编码：utf-8 -*- 创建于2017年6月27日星期二09:19:25 @作者：云金奇E-mail:yunjinqi@qq.com让自己在这个世界上与众不同将熊猫作为螺纹中径导入scipy.stats作为舰对岸(ship to shore)导入数组作为np#葛洲坝df=PD。read _ excel( C:/Users/HXWD/Desktop/600068。xlsx’)df。head()# # # # # # # # # # # #计算数据的基本统计量：均值，方差，偏度，峰度等index=list(df。columns)stock 068=[]for I in range(1，4): scores=np.array(df.ix[:i]) pe=df.ix[:i].describe() pe.name=葛洲坝索引[我]打印(pe) pe[偏度]=sts.skew(分数)pe[峰度]=STS。xsdjdosis(分数)股票068。追加(PE)股票068=PD .数据帧(股票068).Tprint (stock068)#海澜之家df=PD。read _ excel( C:/Users/HXWD/Desktop/600398。xlsx’)df。head()# # # # # # # # # # # #计算数据的基本统计量：均值，方差，偏度，峰度等index=list(df。columns)stock 398=[]for I in range(1，4): scores=np.array(df.ix[:i]) pe=df.ix[:i].describe() pe.name=海澜之家索引[我]打印(pe) pe[偏度]=sts.skew(分数)pe[峰度]=STS。xsdjdosis(分数)股票398。追加(PE)股票398=PD .数据帧(股票398).t打印(库存398)#数据=PD。concat([stock 068，stock398]，axis=1，join _ axes=[data。index])数据=股票068。加入(股票398)打印(数据)数据。to _ CSV(统计. csv) #常用统计量的计算

　　#2018.01.16重新回来看峰度的计算，发现sts.xsdjdosis()，df.xsdjd()两个计算均存在某些问题，与上机指导的描述性统计结果不一致，可能是计算口径不同。借用一篇别人编写纯代码计算的公式，得到了和上机指导一样的结果，代码如下

　　导入mathdef calc(data):n=len(data)牛=0.0牛2=0.0牛3=0.0对于单数据：牛=阿牛2=阿**2牛3=阿**3牛/=n #这是求E(X) niu2 /=n #这是E(X^2) niu3 /=n #这是E(X^3) sigma=math.sqrt(牛2 -牛*牛)#这是D(X)的开方，标准差返回[牛，西格玛，牛3] #返回[英(X)，标准差，E(X^3)]def calc_stat(data): [niu，sigma，Niu 3]=calc(data)n=len(data)Niu 4=0.0 for a in data:a-=Niu Niu 4=a * * 4 Niu 4/=n skew=(Niu 3-3 * Niu * sigma * * 2-Niu * * 3)/(sigma * * 3)xsd JD=Niu 4/(sigma * * 4)return[Niu，sigma，skew，xsdjd] #返回了均值，标准差，偏度，峰度建议计算峰度的程序使用下面的代码