python数据比较,python数据统计与分析
对比分析概念:两个相关指标的比较
类型:绝对数比较(减法)和相对数比较(除法)
相对数的比较分析还包括结构分析、比例分析和动态比较分析。
1.绝对数比较
A.比较指标不能相差太大。
B.折线图、条形图*
#导入数据
Data=pd.read _ csv (c: \ \ users \ \周春竹\ \ desktop \ \ py.test/sample data 02 . CSV ,engine= python) data.head()
(2)折线图的比较
Data.plot (time ,kind= line ,style=-. ,alpha=0.8,fig size=(10,3),title=国王峡谷房屋供应交易对比-折线图)
(2)多个直方图系列的比较
Data.plot (time ,kind= bar ,width=0.8,alpha=0.8,FIG size=(10,3),title=金斯峡谷房屋供应交易对比-条形图)
(3)堆叠图
Fig 3=PLT.figure (fig size=(10,6))PLT . subplots _ adjust(hspace=0.3)#创建子图和区间设置ax1=fig3.add_subplot(2,1,1) x=range(len(data))y1=data[新房交易]y2=-data[新房供应] PLT.bar (x,y1,width=1,face color=黄绿色)PLT.bar (x,y2,width=1,Face=浅蓝色)PLT标题(“住宅新房交易供应-堆栈图”)PLT。Grid () PLT。X Tickets (range (0,30,6))ax1 . set _ Xticklabels(data . index[:6])
(4)差异折线图
Ax2=图3。Add _ Subplot (2,1,2) Y3=data [新房交易]-data[新房供应] PLT。Plot (x,Y3,-go )。Axhline (0,color= r ,)Alpha=0.8) #添加Y轴参考线plt.grid()plt.title(新建住宅成交供应量-差异线)plt。X Tickets (range (0,30,6))ax2 . set _ Xticklabels(data . index[:6])
2.相对数比较
A.相关指标综合计算后的比较,数值是相对的。
b .结构分析、比例分析、空间比较分析和动态比较分析
#导入数据
#导入数据上半年五个销售人员的月销售额数据=PD . read _ CSV( c:\ \ users \ \ Zhou chun Zhu \ \ desktop \ \ py.test/sample数据(销售数据04)。csv ,engine=python )数据
(1)结构分析
在分组的基础上,将各组的总指标与整体的总指标进行比较,计算出各组在整体中的比重,反映整体的内部结构。
#计算日营收比数据[雄达_per]=数据[雄达]/数据[雄达]。sum()data[牛二_佩尔]=data[牛二]/data[牛二]。sum()#转换为百分比数据。应用(lambda x:% .2f%%% (x * 100))数据[牛二_每%]=数据[牛二_每]。apply (lambda x:% .2f%%% (x * 100))数据Figsize=(10,6),sharex=True)#绝对数对比——上半年前熊大和牛二月销量数据[[熊大,牛二]]。plot (kind= line ,style=-. ,alpha=0.8,Ax=axes [0]) axes [0]。legend (loc= upper right) #对比对比3354上半年数据前熊大和牛二单月销量[[熊大_per ,牛二_ per]]。plot (kind= line ,style=-)
(2)比例分析
A.在分组的基础上,比较整体不同部分的指标值,其相对指标一般称为“比例相对数”;
B.比例相对数=总价值的一部分/总价值的另一部分“性价比指数”、“租售比”、“性价比”、“男女比”…
输入数据
Data=pd.read _ csv (c: \ \用户\ \周春竹\ \桌面\ \ py.test/sample数据(租赁价格)。csv ,engine=python)data.head()
#租售比租售比数据[租售比]=数据[均价]/数据[租金] data.head()数据[租售比]。plot.area (color= green ,alpha=0.5,ylim=[100,2000
*(3)动态比较分析(纵向比较分析)
A.比较同一现象在不同时间的指标值,反应现象数随时间发展变化的程度和趋势;
B.最基本的方法,计算动态相对数发展速度;
C.动态相对数(发展速度)=某一现象的报告期值/同一现象的基期值;
D.基期:用于比较的基本期间;
E.报告期:要研究的期间,也称为计算期;*
数据=pd。data frame({ A :NP . random . rand(30)* 3000 1000 },index=PD . period _ range( 2020 01 01 ,2020 01 30 ))print(data . head())print(-)#创建数据企业A 30天内的营业收入#设置基期水平,假设1000数据[基期水平]=1000#累计增长数据[累计增长]=数据[A].plot (fig size=(10,)Alpha=0.8,title=某企业30天营业收入增长(万))PLT。Axhline (0,color= r ,line style=-,Alpha=0.8) #添加Y轴参考线plt.legend (loc=左下)plt.grid () #按折线图数据检查增长[固定增长率]=data[累计增长率]/1000 data[环比增长率]=data[逐期。Data.shift(1)[A]数据[[固定增长率,环比增长率]]。plot (fig size=(10,4),style=-. ,alpha=0.8,title=企业A 30日营业收入增长率)PLT Line=-,alpha=0.8) #添加Y轴参考线PLT . grid()print(data . head())print(-)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。