numpy位运算函数,计算中位数python
1 .说明
数据帧是熊猫库中处理表的数据结构,可以看作是大蟒内类似数据库的操作,是大蟒数据挖掘中最常用的工具。介绍几种数据帧的常用方法。
2 .排线
1 )代码
进口熊猫作为螺纹中径
导入匹配
df=PD.dataframe((key):机智美女)、b)、c、(数据1 ) : ) 1、2、3)、(数据2) 3360 ) 4、5、6)
是打印(df)
对于idx,df.iterrows()中的项目:
是打印(idx)
是打印(项目)
2 )结果
数据一数据2键
0(1) 4a
1 ) 5b
26c
0
数据一
数据2 4
钥匙a
名称:0,数据类型:对象
3 .同时遍历两个数据表
1 )代码
进口熊猫作为螺纹中径
导入匹配
df1=PD.dataframe({key :机智的美女, b , data1 : [ 1,2 ] })
df2=PD.dataframe((key: ) c ,d ),data2 : (4,5))
for(idx1,item1),)idx2,item2) inzip ) df2.iterrows),df2.iterrows)):)
打印(idx1,idx1))。
是打印(项目1 )
打印(IDx2,IDx2))。
打印(项目2 )。
2 )结果
( idx1 ,0)
数据一
钥匙a
名称:0,数据类型:对象
( idx2 ,0)
数据2 4
键c
名称:0,数据类型:对象
( idx1 ,1)
数据1 2
钥匙b
名称:1、数据类型:对象
( idx2 ,1)
数据2 5
键d
名称:1、数据类型:对象
4 .取一行或多行
1 )代码
进口熊猫作为螺纹中径
导入匹配
df1=PD.dataframe((key):足智多谋的美女)、b)、c、(数据1 ) : (1,2,3))
df2=df1[:1]
是打印(df2)
2 )结果
数据一键
0 1 a
5.1取一列或多列
1 )代码
进口熊猫作为螺纹中径
导入匹配
df1=PD.dataframe((key):机智美女)、b)、c、(数据1 ) : (1,2,3))
df2=pd .DataFrame()))。
df2[key2]=df1[key]
是打印(df2)
2 )结果
按键2
0 a
1 b
2摄氏度
6 .列连接(横向)宽度变宽:合并
1 )代码
进口熊猫作为螺纹中径
df1=PD.dataframe((key):足智多谋的美女)、b)、c、(数据1 ) : (1,2,3))
DF2=PD.dataframe({key :机智的美女、 b 、 c 、 data2 : [ 4,5,6 ] }))))。
df3=PD.merge(df1,df2))。
2 )结果
数据一键
0 1 a
1b
2c
数据2键
0 4 a
1 ) b
2c
数据一密钥数据2
0 1 a 4
1b5
2c6
7 .行连接(纵向)变长:串联
1 )代码
进口熊猫作为螺纹中径
df1=PD.dataframe((key):机智美女)、b)、c、(数据):(1、2、3))
df2=PD.data frame ({ key : [ d , e , f}, d))。
ata:[4,5,6]})
df3=pd.concat([df1,df2])
2) 结果
数据键
0 1 a
1 2 b
2 3摄氏度
数据键
0 4 d
1 5 e
2 6层
数据键
0 1 a
1 2 b
2 3摄氏度
0 4 d
1 5 e
2 6层
8.对某列做简单变换
1) 代码
进口熊猫作为螺纹中径
df=pd .DataFrame({key :机智的美女, b , c], data1:[1,2,3]})
打印(df)
df[数据1]=df[数据1] 1
打印(df)
2) 结果
数据一键
0 1 a
1 2 b
2 3摄氏度
数据一键
0 2 a
1 3 b
2 4摄氏度
9.对某列做复杂变换
1) 代码
进口熊猫作为螺纹中径
导入数学
df=pd .DataFrame({key :机智的美女, b , c], data1:[1,2,3]})
打印(df)
df[数据1]=df[数据1]。apply(lambda x: math.sin(x))
打印(df)
2) 结果
数据一键
0 1 a
1 2 b
2 3摄氏度
数据一键
0 0.841471 a
1 0.909297 b
2 0.141120摄氏度
10.对某列做函数处理
1) 代码
进口熊猫作为螺纹中径
def testme(x):
打印(?,x)
y=x 3000
回车y
df=pd .DataFrame({key :机智的美女, b , c], data1:[1,2,3]})
打印(df)
df[数据1]=df[数据1]。应用(测试我)
打印(df)
2) 结果
数据一键
0 1 a
1 2 b
2 3摄氏度
(?, 1)
(?, 2)
(?, 3)
数据一键
0 3001 a
1 3002 b
2 3003 c
11.用某几列计算生成新列
1) 代码
进口熊猫作为螺纹中径
df=pd .DataFrame({key :机智的美女, b , c],数据1:[1,2,3],数据2:[4,5,6]})
打印(df)
df[数据3]=df[数据1] df[数据2]
打印(df)
2) 结果
数据一数据2键
0 1 4 a
1 2 5 b
2 3 6 c
数据一数据2关键数据3
0 1 4 a 5
1 2 5 b 7
2 3 6 c 9
12.用某几列用函数生成新列
1) 代码
进口熊猫作为螺纹中径
导入数学
def testme(x):
打印(x[数据1],x[数据2])
返回x[数据1] x[数据2]
df=pd .DataFrame({key :机智的美女, b , c],数据1:[1,2,3],数据2:[4,5,6]})
打印(df)
df[data3]=df.apply(testme,axis=1)
打印(df)
2) 结果
数据一数据2键
0 1 4 a
1 2 5 b
2 3 6 c
(1, 4)
(2, 5)
(3, 6)
数据一数据2关键数据3
0 1 4 a 5
1 2 5 b 7
2 3 6 c 9
13.删除列
1) 代码
进口熊猫作为螺纹中径
导入数学
df=pd .DataFrame({key :机智的美女, b , c],数据1:[1,2,3],数据2:[4,5,6]})
打印(df)
df=df.drop([data2],axis=1)
打印(df)
2) 结果
数据一数据2键
0 1 4 a
1 2 5 b
2 3 6 c
数据一键
0 1 a
1 2 b
2 3摄氏度
14.一个热点变换(把一列枚举型变为多列数值型)
1) 代码
进口熊猫作为螺纹中径
导入数学
df1=pd .DataFrame({key :机智的美女, b , c], data1:[1,2,3]})
打印(df1)
df2=pd.get_dummies(df1[key])
打印(df2)
df3=pd.get_dummies(df1)
打印(df3)
2) 结果
数据一键
0 1 a
1 2 b
2 3摄氏度
公元前
0 1 0 0
1 0 1 0
2 0 0 1
data1 key_a key_b key_c
0 1 1 0 0
1 2 0 1 0
2 3 0 0 1
15.其它常用方法
1) 求均值方差,中位数等
df[f].描述()
2) 求均值
df[f].平均值()
3) 求方差
df[f].标准()
4) 清除空值
df.dropna()
5) 填充空值
df.fillna()
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。