pandas 数据透视表,pandas 透视表
对于透视表,相信熟悉Excel的朋友都知道怎么用。本文将使用PythonPandas实现透视表功能,有兴趣的可以了解一下。
00-1010样本数据参数介绍常用操作描述大家好,我是丁小洁。
关于pivot table,相信熟悉Excel的朋友都知道怎么用,也了解它的强大,熊猫里实现pivot需要pivot_table。
目录
首先,导入演示数据集。
importpandasaspd
Df=pd.read_csv(销售目标. csv )
df.head()
导入示例数据
主要参数:
数据:DataFrame要操作的值:聚合要操作的列,可选索引:行分组键,行索引列:结果DataFrame的列分组键,列索引aggfunc:聚合函数/结果data frame的函数列表,默认为Numpy.mean。这里注意,如果aggfunc中有函数列表,返回的DataFrame中会显示函数名fill _ value:default None,可以设置默认值dropna:default True。如果该列中的所有值都是NaN,则该列将被删除;True,保留边距:默认为False,设置为true以添加行/列的总数。margins_name:默认显示 ALL ,当margins=True时,可以设置页边距的行/列的名称。
参数说明
使用pivot_table时必须指定索引,因为计算应根据索引进行聚合。
pd.pivot_table(df.head(20)、
Index=订单日期,
aggfunc=np.sum)
通过指定值选择要聚合的列。
pd.pivot_table(df.head(20)、
值=销售目标,
Index=订单日期,
aggfunc=np.sum)
当只为聚合指定index时,使用groupby可以达到相同的效果。
Df.head(20)。groupby([订单日期]) [销售目标]。sum()。重置索引()
添加列参数以对列进行分组。
pd.pivot_table(df.head(10),
值=销售目标,
Index=[订单日期,类别],
Columns=细分,
aggfunc=np.sum)
对于以上结果中的空值,使用fill_value参数将其统一填充为0。
pd.pivot_table(df.head(10),
值=销售目标,
Index=[订单日期,类别],
Columns=[ subdivision],
aggfunc=np.sum,
fill_value=0)
现在按年统计销售数据。此时请注意aggfunc参数。当参数值包含列表时,函数名称将显示在结果数据帧中。
pd.pivot_table(df,
值=销售目标,
Index=[年,类别],
Columns=细分,
aggfunc=[np.sum])
如果需要添加汇总列,只需指定margins=True,并根据需要指定汇总名称。
pd.pivot_table(df,
值=销售目标,
Index=[年,类别],
Columns=细分,
aggfunc=np.sum,
边距=真,
Margins_name= total )
当然,类似于groupby,我们可以指定多种方式同时计算函数。
pd.pivot_table(df,
值=销售目标,
Index=[年,类别],
Columns=[ subdivision],
Aggfunc={ sales target 3360 [max,np.sum]},
fill_value=0)
这就是这篇关于Python Pandas实现数据透视表的文章。关于Python数据透视表的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。