python 分箱函数,
本文主要介绍一些关于python对相同数据进行装箱的技巧。通过示例代码详细介绍,对大家学习或使用Python有一定的参考价值。有需要的朋友可以参考一下。
00-1010前言思路类型一:数字类型二:元组附件:数据可以用Python的cut方法装箱。摘要
目录
最近博主刚刚在工作中使用了数据宁滨操作(对相同的数据进行遍历和比较,避免了所有的遍历和比较,大大减少了计算机IO次数,提高了程序的运行速度)。看了很多博文,也没找到解决办法。写我自己的解决方案!
什么是分箱?
简单来说就是根据具体情况把不同的东西放进指定的容器里,比如把绿色的水果放在一个篮子里,红色的篮子里等等。这个篮子是盒子,水果是数据,颜色是条件。
什么样式的数据要进行分箱
数据主要分为连续变量和分类变量,宁滨的操作主要针对连续变量。
为什么要对数据进行分箱操作
稳定性,时间复杂度,观看舒适,准确率提高等等。
前言
假设last是列表中的第一个(并存储在temp列表中),下面的数据将与第二个中的last进行比较,如果它们相同,则存储在temp中。
当它们不同时,将最后一个数字切换到另一个数字(并存储在temp中),并将temp列表放入一个空列表中。
思路
实现效果
[1,1,1,2,2,2,3,3,4,4,5,5,5,5,5]
#变成
[[1, 1, 1], [2, 2, 2], [3, 3], [4, 4], [5, 5, 5, 5, 5]]
代码实现
box=[1,1,1,2,2,2,3,3,4,4,5,5,5,5]
last=box[0]
temp=[box[0]]
box_list=[temp]
对于一个in box[1:]:
如果a==last:
临时追加(a)
else:
last=a
温度=[a]
box_list.append(临时)
print(box_list) # [[1,1,1]、[2,2,2]、[3,3]、[4,4]、[5,5,5,5]]
#实现根据每个入库列表遍历数据(而不是遍历所有数据)
对于box_list:中的框
对于箱子:中的I
打印(一)
类型一:数字
实现效果
Box=[(小黑,二十,四川,(小黑,二十一,北京,(张三,十八,上海,(张三,二十二,上海)
#实现将同名元组放入一个列表中
[[(小黑,二十,四川,(小黑,二十一,北京)],[(张三,十八,上海),(张三,二十二,上海)
代码实现
Box=[(小黑,二十,四川,(小黑,二十一,北京,(张三,十八,上海,(张三,二十二,上海)
last=box[0][0]
temp=[box[0]]
box_list=[temp]
对于一个in box[1:]:
如果a[0]==last:
临时追加(a)
else:
last=a[0]
温度=[a]
box_list.append(临时)
打印(box_list)
#实现根据每个入库列表遍历数据(而不是遍历所有数据)
对于box_list:中的框
对于箱子:中的I
Print(i[0]) # 0取名字,1取年龄,3取地址。
类型二:元组
进口熊猫作为pd
将numpy作为np导入
来自熊猫进口系列,数据框架
#随机生成一组数据
score _ list=NP . random . randint(25,100,size=20) #随机生成20个数据,最小值25,最大值100。
#隔间间隔
箱=[0,59,70,80,100]
#分割框
score_cat=pd.cut(score_list,bin)
#计算不同间隔的数量
pd.value_counts(score_cat)
#生成一个空数据帧
df=数据帧()
df[分数]=分数列表
df[ name ]=[PD . util . testing . rands(5)for I in range(20)]#生成20个名称
df[ categories ]=PD . cut(df[ score ],bin,labels=[failed , fair , excellent , excellent])
#标签对应于垃圾箱。
附:利用Python的cut方法可以对数据进行分箱。
关于同一数据宁滨的Python实现的文章到此结束。有关Python的相同数据宁滨的更多信息,请搜索流行的IT软件开发工作室以前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。