python 读取excel pandas,pandas.read_excel
除了使用读操作库或者xlwt库进行对超过表格的操作读与写,而且熊猫库同样支持超过的操作;且熊猫操作更加简介方便。
首先是pd.read_excel的参数:函数为:
pd.read_excel(io,sheetname=0,header=0,skiprows=None,index_col=None,names=None,arse_cols=None,date_parser=None,na_values=None,千位=None,convert_float=True,has_index_names=None,converters=None,dtype=None,true_values=None,false_values=None,engine=None,squeeze=False,**kwds)表格数据:
常用参数解析:
io:excel路径;在[10]: import pandas as pd#定义路径IOIn [11]: IO=example.xls#读取[12]中的excel文件:sheet=pd.read _ excel (io=io) #这里因为sheetname默认为0,所以返回[13]中的第一个表:sheetOut[13] : Name,Age, 生日恋爱关系0真诚的烧鹅23 1991-10-02足球朋友1 mndbbz 23 1992-11-02篮球南2小黑25 1991-10-18游泳同学3 zqdjmg 21 1989-09-09游戏南4 sldqz 25 1990-08-07看戏5小米24 1991-12-12足球南5 6大锤1988-26sheetname:默认值为sheetname 0,sheetname=[0,1]用于返回多个表;如果sheetname=None,则返回整个表。注意:int/string返回dataframe,而none和list返回dataframe的dict。
in[7]:sheet=PD . read _ excel( example . xls ,sheet name=[0,1]) #参数为None时,返回所有表格,为表格的字典;#当参数为list=[0 0,1,2,3]这样,返回的多个表也是字典In [8]: sheetOut[8] : {0:姓名,年龄,生日,爱好,关系,0真诚的烧鹅,23,1991-10-02,足球朋友,1 BBZ,23,1992-11-02,篮球,南2,小黑,25,1991-10-18,游泳同学,3 ZQDJMG,21,1988 1: 1 3 5学生0 2 3 4教师1 4 1 9教授} #值是[15]: sheet [0]中的多位数组。 values out [15]:数组([真心烧鹅,23,时间戳( 1991-10-02 00: 00: 00) [MND BBZ ,23,时间戳( 1992-11-02 00: 00: 00 ),篮球,nan],[小黑,25,时间戳( 1991-10-18 00: 00: 00 ),时间戳( 1989-09-09 00:00 时间戳( 1988-09-09 00: 00 )、看一出戏、个人 Dtype=object)#也可以通过[17]中的表名根据表头名称或表位置#读取表的数据:sheet=pd.read _ excel( example . xls ,Sheet name= Sheet 2 )in[18]:Sheet out[18]:1 3 5学生0 2 3 4教师1 4 1 4 1 9教授#通过[19]中表的位置:Sheet=PD . read _ excel sheet name=1)in[20]:sheet out[20]:1 3 5学生0 2 3 4教师1 4 1 9教授header:指定行作为列名。 默认值为0,即取第一行,数据在列名行下面;如果数据不包含列名,设置header=None;#数据不包含[21]中的行作为列名:Sheet=PD . read _ excel( example . xls ,sheet name=1,Header=none)In[22]:Sheet Out[22]:0 1 2 30 1 3 5 Student 1 2 3 4 Teacher 2 4 1 9 Professor #默认第一行数据作为[23]中的列名:Sheet=PD . read _ excel( example . xls ,sheet name=1, Header=0)In[24]:Sheet Out[24]:1 3 5学生0 2 3 4教师1 4 1 9教授skiprows:省略[25]中指定行数的数据:Sheet=PD . read _ excel( example . xls ,sheet name=1,Header=None,skiprows=1)#省略1行数据,从上到下, 省略[26]中的数据行:sheetOut[26]: 0 1 2 30 2 3 4教师1 4 1 9教授skip_footer:省略[27]中尾部的数据行:sheet=PD . read _ excel( example . xls ,sheet name=1,Header=None,skip_footer=1)#省略[28]中尾部的数据行:sheetOut[28]: 0 1 2 30 1 3 5学生1 2 3 4教师index_col:指定还可以使用ustring #将第二列中的数据指定为[30]中的行索引:sheet=PD . read _ excel( example . xls ,sheet name=1,header=none,skip _ footer=1,Index _ col=1)in[31]:sheet out[31]:0 2 313 1 5 Student 3 2 4 Teachernames:指定列名,传入[32]中的列表数据:sheet=PD . read _ excel( example . xls , 工作表名称=1,页眉=无,skip _ footer=1,index _ col=1,names=[a , b , c]) .in [33]: sheetout [33]: a b c 13 1 5学生3 2 4老师一般,熊猫库pd.read_excel不过功能还有待完善或者这个研究不够深入,比如合并单元格的问题。欢迎大家一起讨论交流。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。