Pandas中只有Series和DataFrame这两种数据结构,pandas模块series
本文主要介绍了熊猫系列数据结构的使用,通过示例代码进行了非常详细的介绍,对大家的学习或工作有一定的参考价值。有需要的朋友下面和边肖一起学习。
00-1010一、系列二介绍。实例化Series2.1用一维数组实例化2.2用字典实例化2.3用标量实例化3。系列简单地使用3.1将名称属性添加到系列3.2基于位置的切片3.3基于索引的切片3.4基于条件的切片3.5其他操作
目录
Series是一个类似于一维数组,的对象,它由一组数据(各种NumPy数据类型)和一组相关的数据标签(即索引)组成。简单的系列对象也可以仅从一组数据中生成。
一般来说,Series是一个带标签的一维数组,可以存储整数、浮点数、字符串、Python对象等类型的数据。标签轴通常称为索引。
一. Series 简介
二. 实例化 Series
用一维数组实例化Series时,索引长度必须与数组长度一致。当没有指定索引时,Pandas将帮助我们创建默认的数字索引。
In [1]: s1=pd。系列([1,2,3,4])
Out[1]:
01
12
23
34
dtype: int64
在[2]:中s2=pd。Series([1,2,3,4],index=[a , b , c , d])
[2]:
第一等的
b2
c3
d4
dtype: int64
注意:熊猫支持重复索引。但我们也可以重置索引,具体操作方法会在后续章节给出。
2.1 使用一维数组实例化
用字典实例化Series时,如果没有传入索引,则索引的值是字典的键:
在[1]: pd。系列({i: 0, j: 1, k: 2})
Out[1]:
我0
j 1
k 2
dtype: int64
2.2 使用字典实例化
当用标量值实例化时,必须提供索引.级数按索引长度重复标量值。
在[1]: pd。Series(6,索引=[0,1,2])
Out[1]:
0 6
1 6
2 6
dtype: int64
2.3 使用标量例化
三.Series 简单使用
实例化Series时,可以通过传入name参数将name属性添加到Series中。同时,Seires还支持重命名3360。
In [1]: s=pd。Series(6,index=[0,1,2],name=six )
Out[1]:
0 6
1 6
2 6
名称:六位,数据类型: int64
[2]:年代.姓名
Out[2]: 六
in[3]:s=s . rename( six six six )
[4]:年代
out[4]: 666
3.1 为Series添加Name属性
系列提供了类似于Python list的切片方法:
In[0]: s=pd。Series([1,2,3,4],index=[a , b , c , d])
在[1] :s [033602] #中记下标记为0和1的两个数据(不含2,即从第一个中取两个。
个数据)
Out[1]:
a 1
b 2
dtype: int64
In[2]: s[:3] #取前三个数据
Out[2]:
a 1
b 2
c 3
dtype: int64
In[3]: s[-2:] #取最后两个数据(也可以理解为从倒查第二个数据一直取到末尾)
Out[3]:
c 3
d 4
dtype: int64
In[4]: s[[0,2,3]] #取第1、3、4这个三个数据(注意下标是从0开始的,转换为位置时需+1)
Out[4]:
a 1
c 3
d 4
dtype: int64 #注意:如果输入的位置大于列表的长度则会报出“indexers are out-of-bounds”异常
3.3 基于索引的切片
Series可使用索引标签的值来提取值:
In [0]:s = pd.Series([1, 2, 3, 4], index=[a, b, c, d])
如果传入的索引标签的值不在Seires的轴索引中,那将会报 KeyError 异常,这里建议大家使用Series的 get 方法获取值,如果不存在,则会返回None,同时也可设置default参数,用于不存在时的默认返回值。
In [0]: s = pd.Series([1, 2, 3, 4], index=[a, b, c, d])
3.4 基于条件的切片
In[0]: s = pd.Series([1, 2, 3, 4], index=[a, b, c, d])
在提取区间数据时,如果想让两端的值包含其中(满足两端的值也被提取出来),只需要把 inclusive 参数的值赋为True
3.5 其他操作
Series 不用循环也可以像操作单个数值一样快速进行数学运算:
In[0]: s = pd.Series([1, 2, 3, 4], index=[a, b, c, d])
Series 之间的操作会自动 基于标签 对齐数据. 如果一个Series中的标签在另一个Series中不存在,那么计算得到的结果将是NaN,即缺失值,有缺失值NaN的处理在后续章节也会讲到。因此,我们不用顾及执行操作的Series是否有相同的标签。 Pandas数据结构集成的数据对齐的功能,是Pandas区别于大多数标签型数据处理工具的重要特性。
In[0]: s1 = pd.Series([1, 2, 3, 4], index=[a, b, c, d])
到此这篇关于Pandas数据结构之Series的使用的文章就介绍到这了,更多相关Pandas Series使用内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。