什么是直方图规定化,直方图规定化定义

  什么是直方图规定化,直方图规定化定义

  在数据集上进行了“抓生鱼片”的定量分析,插入了熊猫的cut、groupby和agg方法。

  定量数据分布分析对于定量数据,组数和组宽的选择是评价率分布分析最重要的问题。步骤如下。

  -第一步:非常差的要求[最长时间]

  -第二步:确定组距和组数【组距的观测数据是自己给的。一般组距左闭右开;组数=极端差异/组间距离]

  -第三步:确定积分[即分布区间表]

  步骤4:显示频率分布表。

  第五步:绘制频率分布直方图。

  原则:所有组对象,包括所有数据。每组的组宽度优选相等。

  例:2014年第二季度“捞刺身”菜的销售数据,绘制销售频次分布表和频次分布图,并据此分析量化数据。# browse data importpandesdata=PD . read _ excel(编目_ fish _粥. xls) print (data.max)-data.min))

  第二步:分组。组与组之间的距离与实际情况相差500。

  组数=极差/组间距离=3915/500约8

  第三步:确定积分。

  [ 0,500 ] [ 500,1000 ]…[ 3500,4000 ]

  第四步:建立频数分布的平方表。

  Excel操作

  第五步:绘制频率分布直方图。

  #分析第二季度刺身的销售数据。日销售额为X轴,频率与间距的比值为Y轴。Importadasaspdimportmatplotlib。Pyplotaspltdata=pd.read _ excel(编目 sale ](# print(data。表头))打印)数据[销售]。max)) print (data) 4000]#) #从销量分布范围开始,选择labels=[[0,500],[500,1000],[1000,1500],[2000,2500] data [销售层]=PD . cut . Labels=Labels)print)data[销售层]。head)(print)()sale layer))python . exe d:/python/dedy 1000]1[1000,1500] 2 [0,500] 3 [1500,2000] dype: category categories (8,object): ([0,500][5000]2000]4000()]date sales(level 02014-04-02900(500,1000)12014-12014详情请参考上述代码。

  2.显示2.data.head()数据。在默认的前5行中,您可以指定要显示多少行;相反,默认情况下,data.tail()显示最后五行数据。

  3.原始数据只有两列,date和sale,列名是自己命名的。

  aggres ult=data . group by(by=[ sale hierarchy ]( sale )。agg (np.size) print) aggresult,type) aggresult)) pagg * 100#round(数字,保留小数位)。如果小数位大于0,则通过四舍五入打印(print(paggresult,type(),paggresult) 28)) 2000) 12 [2000,2500 ]8[ 2500,3000 ]3[ 3000,3500 ]4[ 3500,4000] 3 name33660。dtype 3360 int 64 class 2500]9.0[2500,3000 ] 3.0 [ 3000,3500 ] 4.0 [ 3500,4000]dype:float 64 class pandas . core . series . series PPP

  2.聚合运算、计算和接收功能,如2。AgG(func ):max)、min)和size。

  3.round):语法round(数字,保留小数位),如果小数位大于0,四舍五入。

  # panda引入了agg函数,为计算提供了基于列的聚合操作。

  #groupby是分组操作,没有计算或索引聚合。此索引操作返回的对象是一个分组数据框(如果传递的是列表或数组)或一个分组序列。

  # s.groupby ([1,1,2,2])。agg) [min , max]),而agg的func只接受一个参数,s.groupby) [1,1,2,2,]

  与data1相比,min是a,max是b # df。groupby (key1) (data1)(。agg)) a: min , b 3360 max

  重要:使用。在groupby之后立即reset_index()以获得没有多级索引的DataFram。然后可以用df.rename((old_col1):) new_col1),()old_col1)

  参考这篇博客文章https://blog.csdn.net/u 013317445/文章/详情/85268877。

  图标框架大小paggresult.plot kind= bar ,width=0.8,fontsize=10)

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: