pandas库用法,pandas库代码
Pandas是一个易于使用的高性能数据类型和分析工具。
常用的进口方式进口熊猫作为pd
Pandas基于numpy,通常与numpy和matplotlib一起使用。
两种数据类型:系列和数据框架
基于上述数据类型的各种运算,如基本运算、算术运算、特征运算、关联运算等。
Numpy:基础数据类型,侧重于数据的结构表达,维度是数据之间的关系。
熊猫:扩展数据类型,注重数据的应用表达,数据与索引的关系。
类型系列系列类型由一组数据及其相关数据索引组成。
进口熊猫当pda=pd。系列([9,8,7,6])打印(a)
导入熊猫as PDA=pd.series ([9,8,7,6),index=[a , b , c , d]) #自动索引打印(a)
可以创建的系列类型:
列出python字典标量值ndarray其他函数基于ipython的交互环境
字典类型的创建
从n数组类型创建系列类型
可以创建数列的类型:-Python list,index与列表元素的个数相同-标量值,index表示数列类型的大小-Python字典,键值对中的键是index,index从字典中执行选择操作-ndarray,index和数据可以通过ndarray type-other函数,range()函数和Series类型的其他基本操作创建。
系列类型包括索引和值,操作可以类似于ndarray和python字典类型。index来获取索引。值来获取数据。
Series类型的操作和ndarray类型类似:-index方法相同,在[]- NumPy中的操作和运算可以用于Series类型-可以通过自定义索引的列表切片-可以通过自动索引切片,如果有自定义索引就一起切片。
Series类型的操作类似于Python字典类型:-按自定义索引访问-operation中的保留字-use。get()方法。
对齐操作
数列型在运算中会自动对齐不同指标的数据。
序列对象和索引可以有一个名称,该名称存储在属性中。姓名。
系列对象可以随时修改并立即生效。
Series是一维标签数组。它的基本操作类似于ndarray和dictionary,按照索引对齐。
数据帧类型数据帧类型由一组共享相同索引的列组成。
DataFrame是一种表格数据类型,每一列的值类型可以不同。
DataFrame既有行索引又有列索引。
DataFrame常用于表示二维数据,但也可以表示多维数据。
数据帧类型可由以下类型创建:
二维ndaray对象是由一维ndaray、list、dictionary、tuple或Series组成的字典系列类型。其他数据帧类型是从二维数组对象创建的。
从一维ndarray对象字典创建
从列表类型的字典创建
DataFrame是一个带有“标签”的二维数组。其基本操作类似于Series,按行和列进行索引。
pandas库的数据类型操作改变Series和DataFrame对象,添加或重排,重新索引,以及删除drop。reindex()可以更改或重新排列Series和DataFrame索引。
的参数。reindex (index=none,columns=none,…)参数index,新行中的列和列自定义索引fill_value re-index,用于填充缺失位置方法填充方法的值,ffill的当前值向前填充,bfill向后填充。限制最大填充复制默认为真,当一个新对象生成时,如果为假,新老相等将不会被复制。Series和DataFrame的索引属于索引类型,索引对象属于不可修改类型。
常用的索引类型方法。append(idx)连接另一个索引对象以生成新的索引对。diff(idx)计算差集和一个新的索引对象。交集(idx)计算交集。union(idx)计算联合。delete(loc)删除loc位置的元素。insert(loc,e)在loc位置增加。
键入操作算数运算法则
算术运算基于行和列索引,完成后,算术运算默认生成浮点数。
为缺少的项目填写NaN(空值)。
并且广播操作在两个维度、一个维度、一个维度和零维度之间执行。
使用*/符号的二元运算产生新的对象。
算术运算
方法的形式操作方法。add(d,**argws)类型间加法,可选参数。sub(d,**argws)类型间减法,可选参数。mul(d,**argws)类型间乘法,可选参数。div(d,**argws)中间类型划分,可选参数
比较运算
比较只能比较具有相同索引的元素,没有完成。
并且广播操作在两个维度、一个维度、一个维度和零维度之间执行。
领养====!=和其他符号来生成布尔对象。
Series=索引一维数据
DataFrame=按行和列索引的二维数据
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。