pandas的基本数据结构,pandas的三种数据结构
Pandas中有三种数据结构:Series、DataFrame和MultiIndex(旧版中称为Panel)。Series是一维数据结构,DataFrame是二维表格数据结构,MultiIndex是三维数据结构。本文将详细讲解这三种数据结构,有需要的可以参考。
00-1010 1熊猫介绍2熊猫数据结构2.1系列2.2数据框架
目录
WesMcKinney在2008年开发的库
用于数据挖掘的开源python库
在Numpy的基础上,利用Numpy模块的高计算性能。
基于matplotlib,可以轻松画图。
唯一数据结构
Numpy已经能够帮助我们处理数据,结合matplotlib解决一些数据显示等问题。那么熊猫学习的目的是什么呢?
增强图表的可读性和便捷的数据处理能力。读取文件方便打包Matplotlib和Numpy的绘图和计算。
1 Pandas介绍
Pandas中有三种数据结构:Series、DataFrame和MultiIndex(旧版中称为Panel)。
Series是一维数据结构,DataFrame是二维表格数据结构,MultiIndex是三维数据结构。
2 Pandas数据结构
数列是一种类似一维数组的数据结构。它可以保存任何类型的数据,如整数、字符串、浮点数等。它主要由一组数据及其相关索引组成。
2.1.1 Series的创建
#进口熊猫
进口熊猫作为pd
警察。系列(数据=无,索引=无,数据类型=无)
参数:
Data:传入的数据,可以是index: index,如ndarray和list,必须是唯一的,并且等于数据的长度。如果没有传入索引参数,默认情况下将自动创建一个从0到N的整数索引。Dtype:指定索引创建的数据类型:
警察。数列([6.7,5.6,3,10,2],索引=[1,2,3,4,5])
由字典数据创建
color_count=pd系列({ 红色 :100,蓝色 :200,绿色 : 500,黄色 :1000})
颜色计数
2.1.2 Series的属性
为了更方便地操作Series对象中的索引和数据,Series提供了两个属性index和values。
1 .索引
颜色计数.索引
#结果
索引([蓝色,绿色,红色,黄色],dtype=object )
2 .价值观
颜色计数值
#结果
数组([ 200,500,100,1000])
当然,您也可以使用索引来获取数据:
颜色计数[2]
#结果
100
2.1 Series
DataFrame是一个类似于二维数组或表格(如excel)的对象,它同时具有行索引和列索引。
行索引,表示不同的行,水平索引,称为索引,轴0,轴=0列索引,表名不同的列,垂直索引,称为列,轴1,轴=12.2.1 DataFrame的创建.
#进口熊猫
进口熊猫作为
pd
pd.DataFrame(data=None, index=None, columns=None)
参数:
index:行标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。
columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。
举例:创建学生成绩表
# 生成10名同学,5门功课的数据
但是这样的数据形式很难看到存储的是什么的样的数据,可读性比较差!!
问题:如何让数据更有意义的显示?
# 使用Pandas中的数据结构
增加行、列索引:
# 构造行索引序列
2.2.2 DataFrame的属性
1.shape
data.shape
2.index
DataFrame的行索引列表
data.index
3.columns
DataFrame的列索引列表
data.columns
4.values
直接获取其中array的值
data.values
5.T
转置
data.T
输出结果:
6.head(5):显示前5行内容 (很常用)
如果不补充参数,默认5行。填入参数N则显示前N行
data.head(5)
7.tail(5):显示后5行内容
如果不补充参数,默认5行。填入参数N则显示后N行
data.tail(5)
2.2.3 DatatFrame索引的设置
1.修改行列索引值
stu = ["学生_" + str(i) for i in range(score_df.shape[0])]
注意:以下修改方式是错误的
# 错误修改方式
2.重设索引
reset_index(drop=False)
设置新的下标索引
drop:默认为False,不删除原来索引,如果为True,删除原来的索引值
# 重置索引,drop=False
3.以某列值设置为新的索引
set_index(keys, drop=True)
keys : 列索引名成或者列索引名称的列表
drop : boolean, default True.当做新的索引,删除原来的列
df = pd.DataFrame({month: [1, 4, 7, 10],
注:通过刚才的设置,这样DataFrame就变成了一个具有MultiIndex的DataFrame。
到此这篇关于Python Pandas学习之Pandas数据结构详解的文章就介绍到这了,更多相关Python Pandas数据结构内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。