Python 透视表,python 透视表和交叉表
交叉分析:通常用于分析两个或两个以上分组变量之间的变量关系,以及用于变量之间关系对比分析的交叉表形式。
定量和定量分组交叉
定量和定性分析的交叉
定性和定性分组交叉
1交叉统计功能
pivot_table(值,索引,列,聚集函数,填充值)
参数描述:
值:数据透视表中的值
索引:数据透视表中的行
列:数据透视表中的列
Aggfunc:统计函数(总和、计数、平均值)
Fill_value:Na值unity交换
2起案件
进口熊猫
data=pandas.read_csv(
d:\ \ DATA \ \ py case \ \ 5.4 \ \ DATA . CSV
)
#分组查看
# bins分组分区数组
箱子=[
最小(数据。年龄)-1,20,30,40,最大(数据。年龄)1
]
#自定义标签
进口数量
标签=[
20岁及以下, 21岁至30岁, 31岁至40岁, 40岁以上
]
Data[年龄分层]=pandas.cut(
数据。年龄,
垃圾箱,
标签=标签
)
# #执行交叉分析
ptResult=data.pivot_table(
Values=[ age],
Index=[年龄分层],
Columns=[ gender],
aggfunc=[numpy.size]
)
# # #特别注意,去掉括号,改为如下:否则;列是aggfunc、values和colunn的组合。
正确:
ptResult=data.pivot_table(
值=年龄,
指数=年龄分层,
Columns=性别,
aggfunc=numpy.size
)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。