美国疫情实时大数据动态,python疫情数据可视化网站
全球疫情和疫苗接种进展可视化之一——全球疫情动态地图展示;安装plotly库;全球疫情定义工具;数据的函数提取;动态图表的绘制;数据的重采样;分类和直观显示;原始数据的提取;每周对确诊病例进行重新采样;治愈病例;死亡病例
中国疫情与疫苗接种进展的可视化
全球疫情及疫苗接种进度可视化一——全球疫情动态图全球疫情及疫苗接种进度展示二——新冠肺炎疫情气泡图全球疫情及疫苗接种进度可视化三——疫苗研发全球疫情及疫苗接种进度可视化四——各国疫苗接种进度
如果你想了解更多有趣的项目和小工具,可以来找我。
自2020年底以来,欧洲、美洲、印度、中国、俄国和其他国家的制药公司已经推出了针对新冠肺炎的疫苗。本部分对2020年以来的全球疫情、各种疫苗在全球的地理分布、各国的疫苗接种进展进行分析,进行直观展示,为读者提供当前疫情和未来疫情防控的直观展示。
安装plotly库。因为这部分内容主要使用plotly库动态显示数据,所以你要先安装plotly库。
安装Plotly另外,我们还使用numpy和pandas库进行数据处理。如果您没有安装它们,您可以使用下面的命令逐个安装它们
pip install plotly Numpy Pandas # Import所需库Import Pandas as PD Import Numpy as NP Import plotly。表达为PX导入Plotly。全球疫情分析。从2020年开始,世界范围内的感染人数、死亡人数和治愈人数都涉及时间序列数据,因此计划使用Plotly库中的动态图表进行可视化显示。
定义工具函数提取数据#提取数据def fetch _ data(file):df=pd.read_csv(file)#用PD . Read _ csv读取CSV文件#由于美国等国家的数据是按照二级行政区划提供的,需要按国家汇总,去掉了Lat。两列result=df.groupby ([国家/地区])。sum()。drop ([lat , Long],axis=1)。stack()# Redefining index Result=Result . reset _ index()Result . columns=[ country Date , value ]Result[ Date _ ]=PD . to _ datetime(Result . Date)# Generate time index Result=Result . sort _ values(by= Date _ ,axis=0,Ascending=True)# Result=Result . replace( \ * ,regex=true)按时间顺序#有些国家名称中有*的,去掉名称中的* return result绘制动态图表#绘制动态图表def draw_data(df,label, Color): FIG=px.choopleth (df,locations= country ,#选择城市为坐标位置模式= country names ,animation _ frame= date ,#以时间为轴color=value ,#颜色变化选择人数color _ continuous _ scale=[[0, white],[1,color],#以提供的颜色为最大值的颜色标签={value: label},#根据提供的标签绘制图例range_color=[df.value.min(), Df.value.max()])#根据全过程数据的最大值和最小值绘制,不采用autoscale fig.show()重采样#重采样的源数据是按日显示的数据。 为了减少数据显示的计算量,需要每周或每月重采样def resample(df,Period):country _ list=df . country . drop _ duplicates()# Calculate cities得到城市列表temp=df . copy()result=PD . data frame()for I in country _ list:# Re-sample by country,Merge data R _ temp=temp . loc[temp . country==I]#选择对应城市的行R _ temp=R _ temp . drop _ duplicates([ date _ )# Dedupe data R _ dataasfreq()。dropna () #重采样并删除缺失值r _ temp=r _ temp . reset _ index()result=PD . concat([result,r_temp])返回result.sort_values(by=date_ ,axis=0,Ascending=True)数据提取、整理和可视化显示。提取原始数据#提取原始数据确认=fetch _ data(r data/Time _ series _ covid 19 _ Confirmed _ global . CSV )恢复=fetch _ data(r data/Time _ series _ covid 19 _ Recovered _ global . CSV )死亡数=fetch _ data(r data/Time _ series _ covid 19 _ deaths _ global . CSV )按周重采样#按周重采样确认=重采样(Confirmed,W )恢复=重采样(Recovered, W )死亡数=重采样(死亡数, W )确认病例数
这是一个动态图,你可以看到每个时期的变化。这里我给个图,可以详细实现代码观察。
从上图可以看出:
美国的大规模爆发始于2020年4月初,随后是俄罗斯、印度和南美国家。2020年6月后接连爆发,最后在欧洲。2020年底,疫情爆发。从目前全球累计感染人数来看,美国占绝大多数。此外,印度、巴西、俄罗斯和欧洲也有较多的治愈病例#治愈病例draw_data(已恢复,治愈病例数)。
从上图可以看出:
2020年6月中旬后,美国、巴西、印度和俄罗斯治愈的患者更多。2020年下半年印度治愈的病例更多。2020年12月底以后,美国治愈病例数据缺失,导致图像失真(打算找个机会做点数据)。死亡人数死亡人数draw_data(死亡人数,死亡人数,黑色)
从上图可以看出,死亡病例和确诊病例的趋势大致相同。
数据源:
约翰霍普金斯大学系统科学与工程中心(CSSE)的新冠肺炎数据库
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。