名义变量度量变量有序变量,名义变量和实际变量不一致,名义变量度量变量有序变量,名义变量和实际变量不一样
我有以下数据框:
关键产品参数是/否
1个AAA参数1年
1个AAA参数2 N
1个AAA参数3 N
2 AAA参数1牛
2 AAA参数2年
2 AAA参数3岁
3 CCC参数1年
3 CCC参数2年
3 CCC参数3岁
我有兴趣通过刺针和参数列汇总是/否列值并获得以下输出:
生产参数普通
美国汽车协会参数1 1 1
美国汽车协会参数2 1 1
美国汽车协会参数3 1 1
控制台控制电路(Console Control Circuits)参数1 1 0
控制台控制电路(Console Control Circuits)参数2 1 0
控制台控制电路(Console Control Circuits)参数3 1 0
而Y和普通值是来自原始数据帧的是/否列值的计数。
解决方法:
您可以通过创建值为一的附加列来使用数据透视表_表格,因为它们无关紧要(您只计算它们)
df[Y/Ncount]=1
df=df.pivot_table(index=[PROD , PARAMETER],columns=[Y/N],values=[Y/Ncount],
aggfunc=sum,fill_value=0)
df。列=[df。列。get _ level _ values(1)中的列的列]
df.reset _索引()
在这种情况下使用的最简单操作是交叉表,它将产生是/否列中存在的值的频率计数:
pd.crosstab([df[PROD],df[PARAMETER]],df[Y/N])
标签:python,熊猫,dataframe,总结
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。