pandas库的用法,pandas使用详细教程
Pandas库Pandas是一个Python第三方库,提供高性能且易于使用的数据类型和分析工具。
进口pandasas pd
Pandas基于NumPy,通常与NumPy和Matplotlib一起使用。
Pandas库的理解两种数据类型:系列、数据框架
基于上述数据类型的各种运算:基本运算、算术运算、特征运算和关联运算。
NumPy
熊猫
基本数据类型
扩展数据类型
注意数据的结构化表达。
注重数据的应用表达。
维度:数据之间的关系
和数据索引。
Series类型系列类型由一组数据及其相关数据索引组成。
010-5900Python列表:索引与列表元素的数量一致
标量值:index表示系列类型的大小。
Python字典:键-值对中的“键”是索引,索引从字典中选择。
Ndarray:索引和数据可以由Ndarray类型创建。
其他函数:range()函数等。
Series类型可以由如下类型创建系列类型包括索引和值;系列类型的操作类似于ndarray类型;系列类型的操作类似于Python字典类型。
Series类型的操作类似于ndarray类型:1。指标方法相同,采用[];2.NumPy中的操作和运算可用于系列类型;3.您可以对自定义索引列表进行切片;4.你可以通过自动索引切片。如果有用户定义的索引,它将被切片在一起。
Series类型的操作类似于Python字典类型:1。通过自定义索引访问;2.操作中的保留字;3.使用。get()方法。
系列系列
数列型在运算中会自动对齐不同指标的数据。
Series对象和索引都可以有一个名称,它存储在属性中。名称:
系列对象可以随时修改并立即生效。
Series类型的基本操作系列是带有“标签”的一维数组
数据索引0
Series基本操作类似于ndarray和dictionary,根据索引对齐。
总结:数据帧类型由一组共享相同索引的列组成。
DataFrame是一种表格数据类型,每个列的值类型可以不同。DataFrame同时具有行索引和列索引。DataFrame常用于表示二维数据,但也可以表示多维数据。
DataFrame类型2D ndarray对象
由一维数组、列表、字典、元组或序列组成的字典。
系列类型
其他数据帧类型
DataFrame类型可以由如下类型创建DataFrame是一个带有“标签”的二维数组
DataFrame的基本操作类似于Series,按行和列进行索引。
总结:如何更改Series和DataFrame对象?或者添加重排:重新索引,删除:丢弃。reindex()可以更改或重新排列Series和DataFrame索引。
的参数。reindex (index=none,columns=none,…)
参数
解释
索引,列
的新行和列自定义索引
填充值
在重新索引中,用于填充缺失位置的值。
方法
Fill方法,ffill的当前值向前填充,bfill向后填充。
限制
最大填充量
复制
默认情况下,会生成一个新对象;如果为False,则不复制旧对象和新对象。
Series和DataFrame的索引属于index类型,Index对象属于不可修改类型。
索引类型的常用操作方法
方法
解释。追加(idx)
连接另一个索引对象以生成新的索引对象。差异(idx)
计算差集并生成新的索引对象。交叉点(idx)
计算交集。工会(idx)
计算联合。删除(锁定)
删除loc位置的元素。插入(loc,e)
在loc位置增加一个元素e。丢弃()
可以删除由Series和DataFrame指定的行或列索引。
默认情况下,轴=0被删除。
Pandas库的数据类型操作
算术算法:算术运算基于行列索引,完成后默认生成浮点数;填写缺项时填写NaN(空值);在二维、一维、一维、零维之间进行广播操作;使用*/符号的二元运算产生一个新对象。
自动完成,缺少的项目补NaN
方法形式的操作
方法
解释。添加(d,**argws)
类型加法,可选参数。sub(d,**argws)
类型之间的减法,可选参数。mul(d,**argws)
类型乘法,可选参数。分部(d,**argws)
类型除法运算,可选参数
fill_value参数替换NaN,并参与替换后的运算。
不同维度之间有广播操作,一维序列默认参与1轴上的操作。
比较算法:比较操作只能比较索引相同的元素,没有完成;在二维、一维、一维、零维之间进行广播操作;领养====!=和其他符号来生成布尔对象。
相同维度操作,相同大小
不同维度,广播操作,默认为1轴。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。