三小时搞定统计学计算题,三小时搞定统计学百度网盘
一、python安装
Python安装,我们一般安装在windows或者linux。目前常用的版本有python2.7和python3.6.X,但目前python2.7将于2020年取消。建议在线升级到3.x版本,但仍有一些程序运行在python2.7的稳定版本上,因此可能会经常安装两个版本的python。可以安装anaconda,它附带了相关的python科学计算包,对应的版本一般是默认的。一般在AI中需要TensorFlow等机器学习或数据挖掘时,需要使用python3.6.x等相应版本,可以下载anaconda3-5.2.0。有关详细信息,请参考https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/和相应的版本信息。python安装好之后,就可以安装Pycharm了,这是我对python的想法,或者说Jupyter,notebook。阿里目前的sqlFlow使用的是Jupyter,一种通过SQL实现数据机器学习算法的python实现。具体内容可以通过百度查到。Python安装,一般直接用python命令,配置好环境变量后,通过cmd,有些函数在python2或python3中有不同的语法。``` ` Python Python print (123) #在Python 3.x中用此方法print (average:,NP . mean(result)))#在Python 3 . x中用此方法print 123 #在Python 2.x中用此方法print average:,np.mean(result) #python2.x中,在多个版本共存的情况下,Python 2和Python 3需要分别安装。首先安装python2.7,然后在安装过程中注册环境变量;然后安装python3.6版本,并注册环境变量。在修改python编译器的名字,比如:修改D:\python2\,python.exe和pythonw.exe的名字分别是python2.exe和pythonw2.exe;d:在《Python3》中,python.exe和pythonw.exe的名字被改成了python3.exe和pythonw3.exe。一般在python的多个版本中都会用到pip,但是pip只对应一个版本,所以在安装插件的时候需要注意。参考:https://blog.csdn.net/weixin_39986952/article/details/84794537二、pandas 和numpy 环境安装
在本地安装python3.6之后,使用以下命令安装PowerShell Pip Install Pandas.Pip安装编号mpy三、python 实现描述性统计
*excel表格中数据的格式如下:F列是第6列,0.5、现在统计相关量化指标(使用描述性统计)*![在此插入图像描述](https://img-blog.csdnimg.cn/2019113224116494.png)`` ` PowerShell # 1 . import package import panda as PD import numpy as NP from scipy import stats as STS # 2。从excel表中读取数据,对r df=PD进行语义转换。read _ excel(r c:\ users \ Lenovo \ desktop \ apple . xlsx )#获取前5行数据data=df.head()# Output print(获取所有值:\n{0} 。格式(数据))#3。将数据转换成数组,第五个df _ Li=df . values . to list()result=[]for s _ Li in df _ Li:result . append(int(s _ Li[5])# 4。输出原始数据print(原始数据:,result)#原始数据:[6,3,3 4,1,1,2,1,1,3,1,1,2,1,5,1,2,2] #输出排序后的数据print(排序后,Np.sort(result))#排序后[1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 4 5 6]#转换为序列类型parray=pd。系列(结果)#5。平均打印次数平均:,NP。Mean(结果)# python2.7 # print average:,parray . mean()# python 2.7 print( average:,np.mean(结果))# python3.6print (average:,parray . mean())# python 3.6 # average
#6.模式打印( Mode:,parray.mode()。价值观)#模式:【1】因为1、对于消费者来说,更多消费的价值可以反映消费者的消费普及程度,这是一条基准衡量线。
#7.Median print (median:,parray . Median())# Median:2.0 Median,中间的数,众数和均值共同分析数据性质的一种情况,可以初步衡量数据的一个划分和偏度。
#8.四分位数打印(第一个四分位数:,parray.quantile(0.25))打印(第二个四分位数:,parray.quantile(0.5))打印(第三个四分位数:,Parray.quantile(0.75))#第一个四分位数:1.0#第二个四分位数:2.0#第三个四分位数:2.5 #9。极端范围打印(极端范围:,np.ptp(结果))#极端范围:5 #10。平均差异打印(平均差异:)ABS (Parray-Parray。均值())。Mean ()) #平均差:1.103969754253085 # 11。方差打印( Variance:,np.var(result))#方差:2.0847 . 402647471875 Ddof=1)# ddfo计算以numpy为单位的标准差来表示自由度,0为总体标准差,1为样本标准差#因为总体标准差有偏,样本标准差无偏;而在熊猫中,print(标准差:,parray.std())#标准差:1.47575342575277 # 13。四分位偏差打印(四分位偏差:,帕里。分位数(0.75)-帕里。分位数(0.25)) #四分位数偏差:1.5 #14。#异形比打印(异形比:,(len (parray)-STS。mode(parray)[1][0]/len(parray))#异形比:0.6086956521739131 #15。#离散系数print (Discrete coefficient:,Parray.std()/parray.mean())#离散系数:0.6655385232926105 #16。#偏态系数print(偏态系数:,sts.skew(结果))#偏态系数:1.26560160131534 # 16 STS . Kurt osis(结果))#峰态系数:0.5593454201058参考:https://www.cnblogs.com/jasonfreak/p/5441512.html
参考:https://blog.csdn.net/qq_32412759/article/details/77774286
参考:还有一个。这篇文章的python程序参考了它的文章,但是暂时找不到。抱歉。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。