python 分箱函数,

  python 分箱函数,

  本文主要介绍一些关于python对相同数据进行装箱的技巧。通过示例代码详细介绍,对大家学习或使用Python有一定的参考价值。有需要的朋友可以参考一下。

  00-1010前言思路类型一:数字类型二:元组附件:数据可以用Python的cut方法装箱。摘要

  

目录

  最近博主刚刚在工作中使用了数据宁滨操作(对相同的数据进行遍历和比较,避免了所有的遍历和比较,大大减少了计算机IO次数,提高了程序的运行速度)。看了很多博文,也没找到解决办法。写我自己的解决方案!

  什么是分箱?

  简单来说就是根据具体情况把不同的东西放进指定的容器里,比如把绿色的水果放在一个篮子里,红色的篮子里等等。这个篮子是盒子,水果是数据,颜色是条件。

  什么样式的数据要进行分箱

  数据主要分为连续变量和分类变量,宁滨的操作主要针对连续变量。

  为什么要对数据进行分箱操作

  稳定性,时间复杂度,观看舒适,准确率提高等等。

  

前言

  假设last是列表中的第一个(并存储在temp列表中),下面的数据将与第二个中的last进行比较,如果它们相同,则存储在temp中。

  当它们不同时,将最后一个数字切换到另一个数字(并存储在temp中),并将temp列表放入一个空列表中。

  

思路

  实现效果

  [1,1,1,2,2,2,3,3,4,4,5,5,5,5,5]

  #变成

  [[1, 1, 1], [2, 2, 2], [3, 3], [4, 4], [5, 5, 5, 5, 5]]

  代码实现

  box=[1,1,1,2,2,2,3,3,4,4,5,5,5,5]

  last=box[0]

  temp=[box[0]]

  box_list=[temp]

  对于一个in box[1:]:

  如果a==last:

  临时追加(a)

  else:

  last=a

  温度=[a]

  box_list.append(临时)

  print(box_list) # [[1,1,1]、[2,2,2]、[3,3]、[4,4]、[5,5,5,5]]

  #实现根据每个入库列表遍历数据(而不是遍历所有数据)

  对于box_list:中的框

  对于箱子:中的I

  打印(一)

  

类型一:数字

  实现效果

  Box=[(小黑,二十,四川,(小黑,二十一,北京,(张三,十八,上海,(张三,二十二,上海)

  #实现将同名元组放入一个列表中

  [[(小黑,二十,四川,(小黑,二十一,北京)],[(张三,十八,上海),(张三,二十二,上海)

  代码实现

  Box=[(小黑,二十,四川,(小黑,二十一,北京,(张三,十八,上海,(张三,二十二,上海)

  last=box[0][0]

  temp=[box[0]]

  box_list=[temp]

  对于一个in box[1:]:

  如果a[0]==last:

  临时追加(a)

  else:

  last=a[0]

  温度=[a]

  box_list.append(临时)

  打印(box_list)

  #实现根据每个入库列表遍历数据(而不是遍历所有数据)

  对于box_list:中的框

  对于箱子:中的I

  Print(i[0]) # 0取名字,1取年龄,3取地址。

  

类型二:元组

  进口熊猫作为pd

  将numpy作为np导入

  来自熊猫进口系列,数据框架

  #随机生成一组数据

  score _ list=NP . random . randint(25,100,size=20) #随机生成20个数据,最小值25,最大值100。

  #隔间间隔

  箱=[0,59,70,80,100]

  #分割框

  score_cat=pd.cut(score_list,bin)

  #计算不同间隔的数量

  pd.value_counts(score_cat)

  #生成一个空数据帧

  df=数据帧()

  df[分数]=分数列表

  df[ name ]=[PD . util . testing . rands(5)for I in range(20)]#生成20个名称

  df[ categories ]=PD . cut(df[ score ],bin,labels=[failed , fair , excellent , excellent])

  #标签对应于垃圾箱。

  

附:利用Python的cut方法可以对数据进行分箱。

  关于同一数据宁滨的Python实现的文章到此结束。有关Python的相同数据宁滨的更多信息,请搜索流行的IT软件开发工作室以前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: