Python数据可视化,用python进行数据可视化的10种方法
Python echarts数据可视化python echarts数据可视化实战序列语言云分析直方图分析饼图分析总结
python echarts数据可视化简介
介绍
上一章给出了一个简单的例子来说明如何在特定的网页上获取大量的工作数据并建立数据集。如果有数据集,可以可视化进行指标分析。
我们在上一章中搜索的就业数据是存储在Excel中的列表数据:
那么,不熟悉excel使用的同学可能会面临困难。如何将这些数据在不同维度上进行可视化和分析,从而得到想要的结果?别担心,让我们慢慢来。
有各种可视化工具。他们可以实现华丽的可视化。比如echarts,tableau等。这在市场上很常见。对于日常工作中需要解决的可视化任务,有一两个这样的工具就足够了。本文介绍了如何利用python自带的pyecharts包,在不安装更多可视化工具和软件的情况下,轻松实现可视化。
在云分析了我们有大量的工作数据之后,如何才能对这些工作有最直观的了解?云是一个好主意。“云”的概念是形成“关键词云”或“关键词渲染”,是互联网文本中频繁出现的关键词的视觉强调。云可以过滤大量的文本信息,让浏览网页的人只需扫描文本就能知道文本的主旨。下面,我们来看看如何可视化职场名云这个领域。具体的python代码如下。
部署pyecharts相关包,部署构建云所需的软件包,以及来自pyecharts的pandas软件包。chartsimportwordcloudfrompycharts。读取csv文件所需的globalsimports,读取工作场所数据,不同工作场所名称的字数res=pd.read _ csv(。/test . CSV))a _ name=list(RES . workplace信息。value _ counties)。index)a \ a _ count)words=[]for iina:words . append)I)使用WordCloud短语模块调用链模式的扩展。
从图中可以看到,很多从事客服、销售、仓储的岗位,我们爬的网站其实都是经贸学校的就业网站,可以用文字描述的结果也符合经贸学校的定位。
使用直方图分析职场信息时,需要注意的一个指标是薪资分布。那么,我们来看看用直方图观察不同工资区间分布的方法。使用pyecharts可视化直方图的方法如下。
# mychartsimportoptions sasoptsfrompyarts . chartsinport * importpandaspdres=PD . read _ CSV(./) TSV薪资频率统计x _ index=list(RES . salary . value _ counties(。index)y _ value 1=RES . salary . value _ counties)。to _ list)
从图中可以看出,薪酬区间在4500-5499的职场人数最多,有300人。
在饼状图的分析中,根据词频,可以分析出数据最多的职场是什么。此外,从柱状图中可以得到不同薪资区间的职位分布情况。然后,如果要看不同工种的份额,上面两张图是不合适的。饼状图可以很好的展示不同品类的占用率,直观的给出了岗位占用率的实现代码。
#介绍pyechartsimportoptions optsfrompyarts的相关软件包。ChartSimportPage,Pie Import Pandas PD # Read data,test . CSV )x _ index=list)RES . job category。value_counts))进行合并。Y _ value1=资源工作类别。value _ counties)([list(z)z]for zinzip(x _))add,y _ value1()。set _ global _ opts(title _ opts=opts . title pts)
可见卖客服的比例是最高的。
使用本章中的pyeharts工具包来教你如何创建基本的可视化分析图表。当然,这些都是可视化分析的开始,更复杂的场景和可视化还需要进一步探索。
感谢您的阅读。如果你对博客内容的源代码感兴趣,或者想继续获取大数据分析的一系列干货知识,请微信搜索“资深数据分析师”或者扫描下方二维码关注。可以通过微信官方账号的私信获取源代码信息。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。