python基础知识笔记,python自学笔记
# -*-编码:utf-8 -*-
#1.概念:交叉分析,通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式对变量之间的关系进行对比分析;
#交叉可以有三种情况:定量和定量分组交叉;定量与定性分组交叉;与定性分组交叉
#建议相交维度为二维。维度越多越细,越难发现规律。
#2,交叉计数功能:
#pivot_table(值,索引,列,聚集函数,填充值)
#参数描述:
#values:数据透视表中的值(pivot_table返回的表)
#index:数据透视表中的行(包含分组行的列数组,即数据透视表中的行)
#columns:数据透视表中的列(按列分组的列数组,即数据透视表中的列)
#aggfunc:统计函数(即数据表中统计列(由值指定的列)的统计函数。常用的统计函数有计数、求和等。之前学过)
# fill _ value:na值的统一替换
#如需更详细的解释,请参阅http://python.jobbole.com/81212/.
进口数量
进口熊猫
data=pandas . read _ CSV( D:/work spaces/python/python study/27 . CSV )
#27.csv包括栏目:用户ID、注册日期、身份证号、性别、出生日期、年龄。下载地址:https://pan.baidu.com/s/1x38c4wFe-qRSn9yLC93iHQ
bin=[最小(数据。年龄)-1,20,30,40,最大(数据。年龄)1]
标签=[20岁及以下, 21至30岁, 31至40岁, 41岁以上]
Data[年龄分层]=pandas.cut(data。年龄、垃圾箱、标签=标签)
ptResult=data.pivot_table(
Values=[ age],
Index=[年龄分层],
Columns=[ gender],
aggfunc=[numpy.size]
)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。