pandas 代码,pandas代码大全
本文主要介绍六个实用的熊猫数据处理代码,与主题相关,有一定的参考价格价值,可以给朋友们参考一下。
00-1010选择空值行,快速替换列值,对列进行分区,将一列分成多列,改变列的位置,前言:
今天和大家分享一下我总结的6个常用的熊猫数据处理代码。最好掌握经常处理数据的编码员。
目录
在观察数据结构时,这种方法可以快速定位有缺失值的行。
df=pd。DataFrame({A: [0,1,2],
B: [0,1,无],
C: [0,无,2]})
df[df . is null()t . any()]
输出:
美国广播公司
0 0 0.0 0.0 1 1.0南
1 1 1.0南- 2 2南2.0
2 2南2.0
选取有空值的行
在实际的数据处理中,列中的值经常会根据一些限制条件进行替换。
df=pd。DataFrame({name:[Python , Java , C]})
#第一种方式
df[名称]。replace(Java , JavaScript ,inplace=True)
#第二种方式
df . loc[df[ name ]]. str . contains( Java ), name]=JavaScript
输出:
名字名字
0 Python 0 Python
1个Java - 1个JavaScript
2摄氏度2摄氏度
快速替换列值
在很多情况下,对于数值型数据,我们需要进行分区来计算数据在每个区间的出现频率。这个时候pd.cut可以很好的解决这个问题。
随机导入
年龄=random.sample(范围(90),20)
cut_res=pd.cut(age,bin=[0,18,35,60,90])
# cut _ RES type:class pandas . core . arrays . categorial . categorial
cut_res.value_counts()
输出:
(0, 18] 6
(18, 35] 1
(35, 60] 6
(60, 90] 7
对列进行分区
在文本数据清理时,有些列有分隔符(,,,, 3360 )分隔的值,所以我们只需要根据分隔符拆分列即可。
进口熊猫作为pd
Df=pd.dataframe ({ 地址 3360 [四川省成都),
湖北省武汉市,
浙江省杭州]})
res=df[address].str.split(,expand=True)
res.columns=[省,城市]
输出:
省市
0四川省成都市
1湖北省武汉市
浙江省杭州市
expand参数选择是否扩展到DataFrame,如果为False,则返回Series。
将一列分为多列
在同样的清理过程中,经常会出现一些不必要的中文字段,用str.contains过滤即可。
df=pd。数据帧({ 移动电话 :
[15928765644,
15567332235,
现在]})
df[~df[移动电话]. str . contains([ u4e 00- u9fa 5])]
输出:
手机手机
0 15928765644 0 15928765644
1 15567332235 - 1 15567332235
2暂时不可用
中文筛选
有时我们需要调整列的位置。当数据列较少时,我们可以使用以下方法。
df=pd。DataFrame({name: [A , B , C],
年龄 : [10,20,30],
gender: [0,1,0]})
df=df[[姓名,性别,年龄]]
输出:
姓名年龄性别姓名性别年龄
0a 10 0a 010
1 B 20 1 - 1 B 1 20
2 C 30 0 2 C 0 30
如果列的多,就要一一列举,很繁琐。建议插在下面。
col=df[性别]
df.drop(gender ,axis=1,inplace=True)
df.insert(1,性别,列)
这是今天分享的主要内容。练习永远是最好的学习方式,记忆力更强。
以上就是这篇关于六只实用熊猫的数据处理代码。有关熊猫数据处理的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。