Python数据可视化工具,数据可视化PythonExcel表格

  Python数据可视化工具,数据可视化PythonExcel表格

  这里我们就做一个数据的可视化表,一步步看如何获取数据并可视化。

  在前一章中,我们描述了【数据可视化迭代过程】的步骤,我们知道这也包括了整个过程中的步骤。它包括以下几个方面。

  确定题目,获取数据图表,选择(表示)绘制图表。

  当然,你也会发现可视化是一个迭代的过程,在步骤之间需要多次迭代。

  确定主题

  这必须是第一步。在实现数据可视化的时候,先做什么,想从数据中得到什么样的信息,有了目标就可以明确的进入下一步。

  那么这次也会展示空气质量PM2.5的相关数据,了解PM2.5历年的实际情况和发展趋势。

  数据获得

  对于全国空气质量数据,最权威的来源无疑是中国环境监测总站(http://www.cnemc.cn/)提供的数据。但是监控终端的API提供并不详细,很多第三方也提供类似的API接口。比如pm25.in(3358pm25.in/)熟悉API指令,他们的数据每天都有更新。所以这次我选择PM25作为网站来获取数据源。

  可以看到PM25提供了相当多的内容,包括PM2.5、AQI、PM10、CO、NO2、O3等。我们只需要PM2.5数据,所以去掉了其他所有不必要的数据,把Json数据转换成CSV数据格式。这里,数据的转换只是为了方便后面的处理,我们选择了数据可视化的处理。D3。如果用JS和Echart来做,jsON可能会更方便。

  :rgb(51,51,51);font-family:微软雅黑;字体大小:16px文本对齐:居中;行高:30px

  图表选择(表达)

  对于很多人(非设计人员)来说,数据可能很容易获得,但是要把数据转化成合适的图表进行表达却非常困难。因为同样的数据显示在不同的图表中,结果完全不同。通常情况下,Excel是制作图表最常用的方式。在Excel2010版本中,有10个类别的53个图表。还提供了什么数据透视图,自定义图表等等。总之有很多种。然而,尽管图表有很多种,但基本类型只有以下几种:

  图表:用于反映时间趋势。柱形图:用于反映分类项目之间的比较,也可用于反映时间趋势。条形图:用于反映分类项目之间的比较。散点图:用于反映相关性或分布。饼状图:用来反映构成,即部分占整体的比例。地图:用于反映地区之间的分类和对比。我知道了,基本图表的类型,然后怎么选。国外专家安德鲁阿贝拉(Andrew Abela)把图表显示的关系分为四类:对比、分布、构成、联系。然后根据这种分类和数据状态,给出相应的图表类型建议。当我们不确定用什么样的图表时,可以参考这个图表。

  图表绘制

  俗话说【没有编码的交互不是好的数据可视化设计师】,现在市面上有各种各样的可视化方法和工具,但是坦白说【这些可视化工具都是大坑!】,要想做好视觉表现,最好的办法就是掌握一门编程语言。只有这样,你才能把你想要传达的数据信息表达的清晰恰当。

  在这里,我向想跳进数据可视化这个大坑的设计师推荐Processing这种有创意的编程语言(请忽略大程序员)。

  Processing是美国麻省理工学院(MIT)媒体实验室下的美学与计算小组创造的一种编程语言。非常好用,代码逻辑非常简单。几段代码就可以做出非常有效的显示。

  但是Processing没有代码提示的功能,用起来还是很痛苦,经常因为一个字写错,导致程序报错。不过后来我发现Subilme Text可以支持处理的编译环境,而且它可以提供代码提示功能。就像发现了一个新世界。从此,加工不再难用。

  用处理确认实现后,再继续做PM2.5的可视化展示环保部把空气质量分为六个等级,分别用绿、黄、橙、红、紫、棕六种颜色标注。空气质量为优、良、轻度污染、中度污染、重度污染、严重污染。要展示历年PM2.5的实际情况和发展趋势,可以把每天的空气质量换算成不同颜色的小方块,用颜色的差异来展示当天的PM2.5情况。

  先在纸上画一个简单的草图。年已分。下面用一个小方块表示当年各天的空气质量水平,当天的PM2.5值换算成相应的颜色值。

  代码非常简单。大概写了40行就写完了。代码的逻辑很简单,就是导入数据,判断当前数据的值。根据数值不同,属于不同颜色的小方块。

  实现后是这样的。时间线安排在1月到12月。从上图我们可以清楚的看到,污染水平高的时间集中在开始和结束,也就是1-2月和11-12月之间,也就是每年冬天都是PM2.5污染水平高的时间

  我们继续把成都的历史数据形象化,以后再看。我们发现,12年前,成都的空气质量还是不错的。14年,没有温柔的鸽子。可见14年成都的空气质量有多差。15、16年后逐渐开始好转。应该是政府开始管了。我们正在看北京、上海和深圳的天气。

  第一栏是成都2008-16年的空气质量,第二栏是北京,第三栏是上海,第四栏是深圳。可以看到,深圳的空气质量已经完全爆表成都、北京、上海。几乎全是温柔的小鸽子方块。这真是一个居住的好地方。帝都北京的空气质量是四个城市中最差的。

  小结

  把数据可视化后,才能发现数据中更大的意义,最重要的是在实践中去做。本文简单讲解了可视化的整个过程,如何找到数据,做出有意义的可视化图表。希望更多人感兴趣,一起做数据可视化。

  作者:佚名

  资料来源:51CTO

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: