python series用法,python中的series到底是个啥
Python——pandas module-series数据结构-python —— pandas module-series数据结构如果在pandasSeries中创建序列时没有指定索引列,请从0到(n-)并自动创建一个整数类型的索引列index: array length)。数组中的元素类型使用相同的列表,数组生成器Series使用dictionary/dictionary对象方法创建Series。先访问Series.tail再访问SreiesSeries.head()),然后访问Sreies.index显示索引列。显示Sreies.values数据列的系列创建缺失值并检测缺失值。练习搜索序列[索引名称][索引位置下标]切片操作索引位置切片[索引位置:索引位置:步长]索引值切片[
Python——pandas模块系列数据结构pandas
Numpy适合处理统一的数值数组数据。
Pandas旨在处理表单和混合数据。
Panda有两种数据结构。
IESDataFrame Series系列的数据类型为3http://www.sina.com/3358 www . Sina . com/(整数,字符串,浮点数,Python对象等。)3358 www。
索引3354获取3354个索引列
当values——得到3354个数据串时,每个元素可以看作一个字典,整个序列也可以看作一个二维数组。
图:
如果在创建序列时未指定索引列,将自动创建该列。0到(n-1) n个数组长度)。将Panda作为PD # Create obj=pd导入。Series函数中的Series ([4,7,-5,3],传递一个列表。
指定索引列索引(数字,字符串)不同于数组。数组中的元素必须属于同一类型。#通过指定索引列创建系列对象obj=PD . Series)[4,2,-5,3],index=[2,1,1, r_4]。
使用列表和数组构建系列lis=[ 1,2,3,4,5,6,array=NP . arange(7)series _ lis=PD . series(lis)]系列。
与使用字典/字典对象创建序列不同,字典中的键不能重复。
但是,在序列中,索引可以重复。
# dictionary对象模式DIC=DICT(zip(lis,array)) zip package zip) lis,array)运算后,创建一个基于元组列表的series对象Series _ DICT=PD . Series(DIC)print)dictionary对象,直接传递给dictionary方法series _ dict: 3,D:4}) print(直接传递给dictionary创建的Series)print(Series _ DICT 2))。
访问Sreies查看字典并构建系列实例。
dic={Ohio:35000, Texas:71000, Oregon:16000, Utah :5000 } a=PD . series(DIC)pr ingon
Series.head()已经访问了默认的前五个元素。
Print(a.head)) Series.tail))从后面访问默认的五行。
Print(a.tail )2)显示Sreies.index索引列print(a . index)srees . values数据列print (a.values)
Show Series.dtype数据类型使用print(a.dtype) Series创建一个Series对象,方法是使用一个Series创建另一个Series
然后使用创建另一个Series对象。
字典构建系列实例 dic={Ohio:35000, Texas:71000, Oregon:16000, Utah 33605000} a
California , Ohio , Oregon , Texas ])print( Series object by a object:)print(b)创建时,新对象的索引被列为传入索引。
模板的索引直接取它的值。
添加模板没有的索引,并将值设置为缺少的值NaN。
缺失值检测返回一个数据列为bool类型的对象。
True:缺少值
False:不是缺失值
#缺失值检测打印(“缺失值检测”)打印(pd.isnull(b))
非缺失值检测pd.notnull(Series)练习生成一个长度与sd相同的随机数序列。
sd=pd。系列([1,2,3,4,5])
Sd=pd。Series([1,2,4,1,2])#生成一个长度与sd相同的随机数序列a=np.random.random(len(sd))#创建一个Series对象s=pd。系列打印(创建的系列对象:)打印
搜索系列[索引名称]当有相同索引名时,返回多条数据
再次验证了Series对象中索引的名称不是唯一的,可以重复。
# Series[index name]import pandas as PD obj=PD . Series([1,2,3,4],index=[d , f , d , c ])print( created Series:)print(obj 2)obj 2=obj[]
[索引位置下标]下标的取值范围:[o,len(Series.values)]
它可以是:
整数:正数,从0开始。
负数:反转,从-1开始。
#[index position subscript]import pandas as PD obj=PD . series([1,2,3,4],index=[d , f , d , c]) print(索引1的数据:,obj[1])print(最后一个索引)
切片操作ndarray切片操作不同的是,Series切片中的数据除了索引号,还可以是索引值类似于Numpy注意:
当使用索引值进行切片时,索引列中的索引值应该是唯一的,除非切片的起始值是唯一的索引。
索引位置切片[索引位置:索引位置:步长] #索引位置切片导入熊猫为pd obj=pd.series ([1,2,3,4),index=[d , f , d , c]) print (obj [1: 3])
值片[索引值:索引值]当使用索引值进行切片时,索引列里的索引值要唯一,除非切片的起始值为唯一索引
# index position slice import pandas as PD obj=PD . series([1,2,3,4),index=[d , f , d , c]) print (obj [f: c]
当切片起始索引是非唯一索引时
将熊猫作为pdobj=pd导入。Series([1,2,3,4),index=[d , f , d , c])print(obj[d:c]
列重新分配导入熊猫为pd obj=pd.series ([1,2,3,4),index=[d , f , d , c]) obj.index=[一,二,三,四。
Series的运算系列保留了Numpy中的数组运算,可以全部使用Series进行数组运算的时候,索引与值之间的映射关系不会发生改变。
对数值进行系列运算#系列运算import pandas as PD obj=PD . Series([100,200,300,400],index=[one , two , three ,Four ])print( initial array:)print(obj)print( 1 array:)print(-2 initial array:)print(obj-2)print( * 3 initial array:)print(obj * 3)print(
两个系列操作对两个对应的元素执行-*/操作,另一个不返回index,value=NaN。
将熊猫作为pdobj=pd导入。Series([100,200,300,400],index=[一,二,三,四])obj2=pd。Series([1,2,3],index=[a , b , one])print(obj obj2)
当两个系列对象中某个重复索引的数量为倍数时
分别使用Series1的索引对应的值和Series2中重复索引对应的值进行计算并返回。
总结:在操作Series对象时,基本上可以看作是在Numpy中操作ndarray。
ndarray中的绝大多数操作都可以在Series上使用。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。