数据可视化动态图python,python做可视化数据图表
大家好。讲故事是数据科学家的一项重要技能。为了表达我们的想法并说服他人,我们需要有效的沟通。而美丽的可视化是完成这项任务的绝佳工具。
本文将介绍五种非常规的可视化技术,它们可以让你的数据故事更加美观有效。在这里,将使用Python的Plotly图形库,以便您可以轻松地生成动画图表和交互式图表。记得收藏,关注,喜欢。
注:代码、数据和技术交流的完整版本可在最后获得。
安装模块如果您还没有安装Plotly,只需在您的终端上运行以下命令来完成安装:
安装Plotly可视化动态图表在研究这个或那个指标的演变时,我们经常会涉及到时间数据。Plotly动画工具只需要一行代码就可以让人们观看数据随时间的变化,如下图所示:
代码如下所示
将plotly.express导入为px
从vega_datasets导入数据
df=data.disasters()
df=df[df。1990年]
fig=px.bar(df,
y=实体,
x=死亡,
animation_frame=年,
方向=h ,
range_x=[0,df。Deaths.max()],
color=Entity )
#改善美观(尺寸、网格等。)
图.更新布局(宽度=1000,
身高=800,
xaxis_showgrid=False,
yaxis_showgrid=False,
paper_bgcolor=rgba(0,0,0,0),
plot_bgcolor=rgba(0,0,0,0),
title_text=自然灾害的演变,
showlegend=False)
fig.update_xaxes(title_text=死亡人数)
图. update_yaxes(title_text= )
Fig.show()只要有一个要过滤的时间变量,那么几乎任何图表都可以被动画化。以下是散点图的动画示例:
将plotly.express导入为px
df=px.data.gapminder()
fig=px.scatter(
df,
x=gdpPercap ,
y=lifeExp ,
animation_frame=年,
大小=流行,
color=洲,
hover_name=国家,
log_x=True,
size_max=55,
range_x=[100,100000],
range_y=[25,90],
# color _ continuous _ scale=px . colors . sequential . em rld
)
图.更新布局(宽度=1000,
身高=800,
xaxis_showgrid=False,
yaxis_showgrid=False,
paper_bgcolor=rgba(0,0,0,0),
Plot_bgcolor=rgba(0,0,0,0))太阳图太阳图是可视化group by语句的好方法。如果你想用一个或多个类别变量来分解一个给定的数量,那么使用太阳图。
假设我们要基于每天的性别和平均时间偏差提示的数据,这种double group by语句通过可视化比表格更有效地显示出来。
该图表是交互式的,允许您自己点击和探索类别。您只需要定义所有的类别,声明它们之间的层次结构(参见下面代码中的parents参数)并分配相应的值。这是本例中group by语句的输出。
导入plotly.graph_objects as go
将plotly.express导入为px
将numpy作为np导入
进口熊猫作为pd
df=px.data.tips()
fig=go。图(去。旭日(
标签=[女性,男性,晚餐,午餐,晚餐],
parents=[, ,女性,女性,男性],
values=np.append(
df.groupby(sex).tip.mean()。价值观,
df.groupby([sex , time]),tip.mean()。值),
marker=dict(colors=px . colors . sequential . em rld)),
布局=go。布局(paper_bgcolor=rgba(0,0,0,0),
plot_bgcolor=rgba(0,0,0,0)))
fig . update _ layout(margin=dict(t=0,l=0,r=0,b=0),
title_text=按性别、时间和日期划分的小费习惯)
Fig.show()现在让我们添加另一层到这个层次:
为此,我们添加另一个group by语句的值,该语句涉及三个类别变量。
导入plotly.graph_objects as go
将plotly.express导入为px
进口熊猫作为pd
将numpy作为np导入
df=px.data.tips()
fig=go。图(去。旭日(标签=[
“女性”,“男性”,“晚餐”,“午餐”,“晚餐”,“午餐”,“Fri”,“星期六”,
孙,周四,周四, Fri ,周六,孙, Fri ,周四
],
父母=[
,,女性,女性,男性,男性,
晚餐,晚餐,晚餐,晚餐,
"午餐","午餐","晚餐","晚餐",
晚餐、午餐、午餐
],
values=np.append(
附加(
df.groupby(sex).tip.mean().价值观,
df.groupby([sex ,
time])、tip.mean().价值观,
),
df.groupby([性别,时间,
day])、tip.mean().值),
marker=dict(colors=px。颜色。连续的。em rld)),
布局=去吧.布局(paper_bgcolor=rgba(0,0,0,0),
plot_bgcolor=rgba(0,0,0,0)))
图update _ layout(margin=dict(t=0,l=0,r=0,b=0),
title_text=按性别、时间和日期划分的小费习惯)
图显示()指针图指针图仅仅是为了好看。在报告关键业绩指标等成功指标并展示其与你的目标的距离时,可以使用这种图表。
导入plotly.graph_objects as go
去吧.图(去。指示器(
domain={x: [0,1], y: [0,1]},
值=4.3,
模式=仪表号增量,
title={text :成功指标 },
delta={reference: 3.9},
仪表={bar: {color: lightgreen},
轴:{ 范围:[无,5]},
步骤:[
{ 范围:[0,2.5],颜色:浅灰色 },
{ 范围:[2.5,4],颜色:灰色 }],
}))
图显示()桑基图另一种探索类别变量之间关系的方法是以下这种平行坐标图。你可以随时拖放、高亮和浏览值,非常适合演示时使用。
代码如下
将plotly.express导入为像素
从vega _数据集导入数据
进口熊猫作为螺纹中径
df=data.movies()
df=df.dropna()
df[流派_id]=df .Major_Genre.factorize()[0]
fig=px.parallel _ categories(
df,
维度=[美国电影协会评分,创意类型,专业类型],
color=流派标识,
color _ continuous _ scale=px颜色。连续的。em rld,
)
图显示()平行坐标图平行坐标图是上面的图表的衍生版本。这里,每一根弦都代表单个观察。这是一种可用于识别离群值(远离其它数据的单条线)、聚类、趋势和冗余变量(比如如果两个变量在每个观察上的值都相近,那么它们将位于同一水平线上,表示存在冗余)的好用工具。
代码如下
将plotly.express导入为像素
从vega _数据集导入数据
进口熊猫作为螺纹中径
df=data.movies()
df=df.dropna()
df[流派_id]=df .Major_Genre.factorize()[0]
fig=px.parallel _坐标(
df,
尺寸=[
IMDB_Rating , IMDB_Votes , Production_Budget , Running_Time_min ,
美国总收入,全球总收入,美国数字影碟销售
],
color=IMDB_Rating ,
color _ continuous _ scale=px颜色。连续的。em rld)
图显示()技术交流欢迎转载、收藏、有所收获点赞支持一下!数据、代码可以找我获取
目前开通了技术交流群,群友已超过2000人,添加时最好的备注方式为:来源兴趣方向,方便找到志同道合的朋友
方式、微信搜索公众号:Python学习与数据挖掘,后台回复:加群
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。