pandas读取excel表数据,pandas读取excel文件
欢迎,来自211.103.135.163的朋友们。
在开始教程之前,我们需要先了解什么是Excel,这将有助于我们理解后续教程中的内容。
Excel是什么?
Excel是微软公司生产的办公软件。
它可以创建和编辑带有“xls”和“xlsx”后缀的电子表格文件。
Excel文件可以在Windows、macOS、Android和iOS系统中使用。
自1993年发布5.0版本以来,Excel已经成为电子表格事实上的标准。
Excel的使用
起草
数据透视表
单元格计算
当然,Excel经常用于办公,做各种报表。
为什么选择Excel?
虽然市面上有很多电子表格工具可供选择,但Excel以其丰富的功能被大家所接受,也因为很多企业用户使用Excel,使其更具竞争力。
Python中读取Excel文件的教程
现在,我们将演示如何使用Python语言读取Excel文件的内容。你可能觉得用这种方式读取Excel文件的内容很难,其实不然。我们会逐渐认识到这一点。
1.创建新项目。
首先,创建一个项目,然后在项目文件夹中添加一个名为“read_excel.py”的文件。
2.创建一个Excel文件
出于演示目的,我们创建一个名为“books.xls”的Excel文件,其内容如下:
如你所见,这个Excel文件包含了书籍的一些基本信息,我们通常都是这样使用Excel的。
3.安装Python库
我们现在要做的就是安装可以读取Excel文件内容的Python库。当然,有很多库可以做到这一点。这里我们选择常用的熊猫库。使用熊猫图书馆有几个原因:
Pandas是一个基本的NumPy软件库,它可以提供易于使用的Python数据结构和数据分析工具。
Pandas不仅功能强大,而且非常灵活,经常用于数据分析。
要安装Pandas库,您可以使用以下命令:
pip安装熊猫
为了从Excel电子表格中读取数据,我们还需要使用xlrd库。当然,可以安装pip:
pip安装xlrd
4.读取Excel文件
现在,让我们编写一个代码来读取“books.xls”文件的内容:
进口熊猫作为pd
file=books.xls
data=PD . read _ excel(file)#读取文件
打印(数据)
代码解释:
首先,介绍熊猫模块。
初始化一个变量“file”来存储Excel的文件名。请注意,该示例没有给出确切的文件路径,而只是给出了文件名。那么系统会默认使用当前路径,即把“books.xls”放在项目文件夹下,把“read_excel.py”放在同一个目录下。
调用熊猫模板的read_excel方法,将“books.xls”的内容读入变量数据。
最后,数据变量的内容在终端打印出来。
如果一切正常,终端上将显示以下结果:
5.修改阅读内容
如果要修改从Excel文件中读取的内容,比如将“Author”中“HubDae”的值改为“Daehub”,可以参考下面的代码:
进口熊猫作为pd
file=books.xls
def convert_author_cell(单元格):
if cell==HubDae :
返回“Daehub”
返回单元格
data=pd.read_excel(file,converters={ Author :convert _ Author _ cell })
打印(数据)
代码解释:
首先定义转换单元格内容的函数“convert_author_cell(cell)”,该函数以读取的单元格为参数,返回值也是单元格。
读取的单元格内容由“convert_author_cell(cell)”函数转换。
再次调用“read_Excel”方法读取Excel文件,添加converters参数,参数值为Python字典类型,键为Excel字段名,值为对应单元格的值。
读取Excel文件时,会在“作者”字段上调用“convert _ Author _ cell (cell)”函数。
执行代码后,您将看到以下结果:
可以看到,此时读取的Excel文件内容已经发生了变化。但这只是修改了内存中的数据,并没有改变文件本身的内容。可以用Excel软件打开“books.xls”文件,发现此时其内容并没有发生变化。
6.Python写入Excel文件
此外,我们将学习如何使用Python将数据写入Excel文件。这需要使用“xlwt”,我们也使用pip进行安装:
pip安装xlwt
Xlwt是一个软件包,用于创建兼容Excel 2003的软件。
Xlwt本身是Python标准包写的,没有任何其他依赖包。
现在,让我们编写一个简单的程序段来创建Excel文件:
进口熊猫作为pd
file=books.xls
data=pd.read_excel(文件)
#编写excel文件
data.to_excel(new.xls ,sheet_name=Student )
代码解释:
要写一个Excel文件,需要调用“to_excel”方法。
该方法接受两个参数,一个是书面文件名,例如“new.xls ”,另一个是工作簿名称,即Excel中的工作表名称,例如“Student”
执行完这段代码后,当前项目文件夹中会创建一个名为“new.xls”的文件,其内容与“books.xls”略有不同:
7.将不同的数据段写入同一Excel文件中的不同工作簿。
以下代码是将不同数据段写入同一Excel文件的不同工作簿的示例,这需要“DataFrame”方法:
进口熊猫作为pd
#创建数据框架
df_stock=pd。数据帧({
tickers:[谷歌, WMT , MSFT],
价格:[400,600,900],
每股收益:[20.80,6.90,90.8]
})
df _天气=pd。数据帧({
日:[ 2017年1月9日, 2017年2月9日, 2017年3月9日],
温度:[40,60,30],
事件:[下雨, zxddg ,下雪]
})
和警察一起。excel writer( stocks _ weather . xls )作为作者:
df_stock.to_excel(writer,sheet _ name= stocks )
df_weather.to_excel(writer,“weather”)
代码解释:
首先,调用DataFrame方法创建两个数据对象。
然后调用ExcelWriter方法创建一个对象来写Excel文件。
最后调用数据对象的to_Excel方法将数据写入Excel文件,对应的工作簿命名为“股票”和“天气”
代码执行成功后,项目文件夹中会创建一个名为“stocks_weather.xls”的文件,其中包含两个工作簿,如下图所示:
以上是Python读写Excel文件的简单教程。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。