python数据分析百度百科,python数据分析基础和利用python进行数据分析
Python数据特征分析-对比分析对比分析1。绝对数对比减法生成数据折线图对比直方图对比直方图叠加图对比差额折线图对比2、对数对比分结构分析生成数据计算限额比例绘制折线图对比AB产品比例分析创建数据-消费-收入比例-面积图表达空间对比分析(横向对比分析)创建数据通过柱状图进行横向对比四个产品总销售额系列柱状图、 四款产品前十天销量横向对比(纵向对比分析)介绍:创建数据计算产品30天内的累计增长和逐期增长,通过折线图查看。
对比分析
介绍:比较分析两个相关指标之间的比较。
分类:绝对数比较(减法)/相对数比较(除法)、结构分析、比例分析、空间比较分析、动态比较分析。
1.绝对数比较相减生成数据#相互比较的指标不能相差太大#创建数据A/B产品30天内的日销量data=PD . data frame(NP . random . rand(30,2) * 1000,columns=[a _ sale , b _ sale],Index=PD . period _ range( 2017 06 01 , 20170630)) print (data.head())折线图比较数据. plot (kind= line ,style,=0.8,图形大小=(10
Compare data.plot (kind= bar ,width=0.8,alpha=0.8,fig size=(10,3),title= AB产品销售比较-直方图)
*
直方图比较图3=PLT。图形(图形大小=(10,6)) PLT。支线剧情_ adjust (hspace=0.3) #创建支线剧情,设置区间ax1=图3。Add _ subplot (2,1,1)x=range(len(data))y1=data[ A _ sale ]y2=-data[ B _ sale ]plt . bar(x,y1,width=1,Face color= yellow green )PLT . bar(x,y2,width=1,Face=浅蓝色)PLT。标题(“AB产品销售对比-堆栈图”)PLT。Grid () PLT。X Tickets (range (0,30,6))ax1 . set _ Xticklabels(data . index[:6])
*
可以清楚的看到,同时AB产品的销量差异折线图对比ax2=fig3.add _ plot (2,1,2)y3=data[ a _ sale ]-data[ b _ sale ]PLT . plot(x,y3,-go) PLT。Color= r ,linestyle=-,alpha=0.8) #添加Y轴参考线plt.grid()plt.title(AB产品销售对比-差异线)plt.x tickets (range (0,30,6)) ax2.set _ xticklabels(
*
同时,红线以上,A的销量高于B产品的销量,红线以下,B的销量高于A产品的销量。
2.相对数比较划分结构分析。在分组的基础上,将各组的总指标与整体的总指标进行比较,计算出各组在整体中的比重,反映整体的内部结构。
生成数据data=PD . data frame({ a _ sale :NP . random . rand(30)* 1000, b _ sale :NP . rand . rand(30)* 200 },index=PD . period _ range( 2017 06 01
计算配额比例数据[a _ per]=数据[a _ sale]/数据[ a _ sale ]。sum()data[ b _ per ]=data[ b _ sale ]/data[ b _ sale ]。sum()。=data [a _ per]。apply(lambda x: % . 2f % % %(x * 100))data[ b _ per % ]=data[ b _ per ]。应用(x: % . 2f % % % %
画个折线图对比AB积#的绝对值,很难看出结构变化。通过看销售额占比来看销售额的对比。图,轴=PLT。支线剧情(2,1,FIG size=(10,6),Sharex=true)数据[[a _ sale , b _ sale]]。绘图样式= -. ,alpha=0.8,ax=axes[0])axes[0]。legend(loc=upper right )数据[[A_per , B_per]]。plot(kind=line ,style= -. ,alpha=0.8,ax=axes[1])axes[1]。图例(loc=右上)*
比例分析
简介:在分组的基础上,比较整体不同部分的指标值。相对数一般称为“比例相对数”,比例相对数=整体的一部分/整体的另一部分“基本建设中工业、农业、教育的投资比例”、“男女比例”……
创建数据-消费-收入比-面积图表示数据=pd.dataframe ({ 消费:np.random.rand (12) * 1000 2000,工资:NP . rand(12)* 500 5000 },Index=pd.period _ range (2017/1 , 2017/12 ,freq= m )print(data . head())print(-)#创建数据某人一年内的消费、工资、薪金#消费head ()) #比例相对数消费-收入比数据[c _ s]。plot . area(color= green YLIM=[0.3,0.6],FIG size=(8,3),grid=true) #创建区域地图表示*
消费与收入的比例从面积图上可以看得很清楚。
空间对比分析(横向对比分析)介绍:对同一时间不同空间中相似现象的指标值进行比较,反映不同空间中相似现象的差异程度和现象发展的不平衡性。空间比较相对数=空间A中某个现象的价值/空间B中类似现象的价值,一个很现实的例子从绝对量上看,中国多种经济总量世界第一,但从人均水平上看就是另一回事了。
create data data=PD . data frame({ a :NP . random . rand(30)* 5000, b: np.random.rand (30) * 2000, c: np.random.rand (30) * 10000, d index=PD . period _ range( 2017 06 01 , 2017 06 30 ))print(data . head())print(-)*
通过直方图进行横向比较四个产品的总销售额data.sum()。为zip中的I,j绘制(kind= bar ,color=[r , g , b , k],alpha=0.8,grid=true)(范围(4),数据).
*
系列条形图,横向比较四种产品在前十天的销售数据[:10]。Plot (kind= bar ,color=[r , g , b , k],alpha=0.8,grid=true,fig size=(12,4),宽度
*
#关于同比对比与环比对比#产品A 2015年3月与2016年3月同比对比(相邻时间段相同时点)#产品A 2015年3月与2015年4月环比对比(相邻时间段对比)#如何定义“相邻时间段”与“时点”,决定是同比还是环比动态对比分析(纵向对比分析)简介:#比较同一现象在不同反应现象数随时间发展变化的程度和趋势#最基本的方法,计算动态相对数发展速度#动态相对数(发展速度)=某一现象的报告期值/同一现象的基期值#基期:比较的基期#报告期:要研究的期间,也称为计算期内创建的数据产品A在30天内的销售数据=PD . data frame({ A :NP . random . rand(30)* 2000 1000 },index=
计算累计增长和逐期增长数据[base]=1000 #假设基期销售额为1000,则以后每一天都是计算期数据[l _ growth]=数据[ a ]-数据[base] #累计增长=报告期级别-固定基期级别数据[z _ growth]=数据[ a ]-数据. shift (1) [a
请参阅按折线图数据显示的增长[[L _ growth , Z _ growth]]。plot (FIG size=(10,4),style=-. =0.8)PLT。Axhline (0,hold=none,color= r Alpha=0.8)#添加Y轴参考线plt.legend (loc=左下角)plt.grid()
*
检查开发速度数据[l速度]=数据[l _增长]/1000 #固定增长速度数据[z速度]=数据[z _增长]/data.shift (1) [a] #连锁增长速度数据[[ l速度] Z速度]]。plot (FIG size=(10,4),style=-。=0.8)PLT。Axhline (0,hold=none,color= r ,line style=-,alpha=0.8) # add
*
Python数据要素分析
1.Python数据要素分析-分布分析
2.Python数据要素分析-比较分析
3.Python数据要素分析-统计分析
4.Python数据特征分析-善意夜间分析
5.Python数据要素分析-正态性检验
6.Python数据要素分析-相关性分析
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。