python实现可视化图表,python数据可视化分析报告

  python实现可视化图表,python数据可视化分析报告

  一、数据获取在国家统计局网上下载第六次人口一般统计表http://www.stats.gov.cn/tjsj/pcsj/rkpc/6rp/indexch.htm

  然后用熊猫将超过数据解析为多级词典

  首先观察超过数据

  可以转换成这样的多级词典。

  整理词典关系使代码变得简单

  def getDataDict ) : #skiprows是跳过的行的下标(下标从0开始),=2从第三行开始,返回类型为数据框数据框=熊猫。读取_退出行使用#地图函数后,转换为地图型数据。请注意,返回目录类型race list=list (lambdas : str (s).替换((xa0),() )、dataframe.iloc(0)).tolist()(年龄分类列表年龄列表=列表(map (lambdas : str ) s).替换((xa0),) ),0).收件地址列表排序data dict=ordered dict(foriinrange)len)raceDict)):#获取民族的名称race=race list[I]racedict=ordered dict)#丢失到保证获取的列表中的racedict关键字列表=数据帧。iloc[1,1 * I : # 13 * i3 ].to list(forjinrange(len)racedictkeylist)330获取女性racedictkey=racedictkeylist ) j的trdDict的价值值年龄值列表=数据帧。iloc[2:1 * Ij].tolist(TRDdict=ordereddict)在trdDict中插入价值(年龄)forkin range(len)年龄值列表)(3360 age=str)

  二。全国男女、年龄人口直方图代码:

  defshowchart 1(:男性字典=数据字典。获取(合计) ).获取(男))femaleDict=dataDict.get(合计) ).获取)女。itemsinenumerate ([男性字典项目]、女性迪克特。items):age list=[]numList=[]for k,vinitems3360ifstr(k).判断字符是否为数字或str (k ) k )=(100岁以上):if ) str ) k )=(100岁以上))3360k=) 100)代理男性列表ifi==0: male=py plot.bar (age list,numlist,color=b ) else: #女性列表的底部对应于男性列表,达到层叠效果的female=bottom=maleNumList,color= r )py图。RC params[ font。sans-serif ]=[ sim hei ]py plot。标题(全国男女,年龄)

  折线图:

  因为是2010年的数据,所以年龄在0-20之间,现在已经9-29岁了。这个男女比例也太难了

  三、全国人口年龄阶段分布图pyplot似乎达不到标签线条指出的效果,占比太小,标签文字重叠,索性进行了75岁以上的统计

  defshowchart 2(:data=data dict。获取(合计) ) (合计))年龄计数list=[]agelabellist=[]fork,vindata .)=合计andstr(k)!= nan :agecountlist。append(int(v)agelabellist。append(k)k)index=agelabellist。索引( 75-79岁))else:passagecountlist[index]=numoldagelabellist[index]= 75岁以上age count list=age count list[:index 1]age lagel py图。RC params[ font。sans-serif ]=[ sim hei ]py plot。pie(agecountlist,labels=ageLabelList,countercled

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: