python分析excel数据 绘制直方图,python直方图怎么分析
最近,我接受了制作一系列数据的频率分布直方图的任务。直方图是高中学过的知识,但在科研和数据分析中仍然占有很高的地位。一开始我以为只用Excel就能轻松实现,但是对Excel的描述不熟悉,花了半天时间才在Python上实现。
该实验对数据预处理和绘图经验有一定的参考意义。所以写下来。
数据预处理不同于其他图解。直方图只需要一列数据。显示此列中每个数据的频率分布。
实验使用的数据是微博数据,经过处理后得到微博用户的一系列轨迹数据。
图中Sum2是轨道号,line是轨道号。(本文展示的是随机构建的数据,与真实结果不符)
因为是不同用户的轨迹,所以需要通过arcgis的聚合功能以line为关键字来聚合sum2。Python的group_by函数也可以实现这个功能。
可以做一个最终得到曲目数量的曲目数量直方图,分析研究区域内用户访问曲目的频率。如果有不经常访问的磁道,则是无效数据,必须加以区分。
1、直方图、excel绘图
将数据导出为excel表格格式。选择数据列并插入直方图。
初始化图形的下标是不合适的。您可以单击X轴来选择“设置轴”菜单。盒子的宽度可以是盒子的宽度,也就是直方图的区间。
下图是调整后的图片。
2.Python实现
Python可以用matplotlib库画图。附上代码;其中a是列表元素。例如,a=[1,2,3,4,5,6,7]
FrommatPlotlibimportplot计算组数d=800 #组距num _ bins=int((max(a)-min)a)/d(Print)max),min max(a)-min(a)a))Print)num _ bins)图形大小PLT.
在使用for循环遍历时,每次在remove中删除一个值为0的元素,列表中的下一个元素就会向前移动,指针就会向后移动并丢失,这样就有可能去除残数。
for range(a):if)I==0):a . remove(I)I)的正确方法如下:
importadasapddf=PD . Read _ CSV(data . CSV),encoding=utf-8) #读取数据文件a=df [frequency]。托里西斯
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。