名义变量度量变量有序变量,名义变量和实际变量不一致,名义变量度量变量有序变量,名义变量和实际变量不一样

  名义变量度量变量有序变量,名义变量和实际变量不一致,名义变量度量变量有序变量,名义变量和实际变量不一样

  我有以下数据框:

  关键产品参数是/否

  1个AAA参数1年

  1个AAA参数2 N

  1个AAA参数3 N

  2 AAA参数1牛

  2 AAA参数2年

  2 AAA参数3岁

  3 CCC参数1年

  3 CCC参数2年

  3 CCC参数3岁

  我有兴趣通过刺针和参数列汇总是/否列值并获得以下输出:

  生产参数普通

  美国汽车协会参数1 1 1

  美国汽车协会参数2 1 1

  美国汽车协会参数3 1 1

  控制台控制电路(Console Control Circuits)参数1 1 0

  控制台控制电路(Console Control Circuits)参数2 1 0

  控制台控制电路(Console Control Circuits)参数3 1 0

  而Y和普通值是来自原始数据帧的是/否列值的计数。

  解决方法:

  您可以通过创建值为一的附加列来使用数据透视表_表格,因为它们无关紧要(您只计算它们)

  df[Y/Ncount]=1

  df=df.pivot_table(index=[PROD , PARAMETER],columns=[Y/N],values=[Y/Ncount],

  aggfunc=sum,fill_value=0)

  df。列=[df。列。get _ level _ values(1)中的列的列]

  df.reset _索引()

  在这种情况下使用的最简单操作是交叉表,它将产生是/否列中存在的值的频率计数:

  pd.crosstab([df[PROD],df[PARAMETER]],df[Y/N])

  标签:python,熊猫,dataframe,总结

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: