python读取文件中的列表,python提取excel表中指定列的值
本文主要介绍python根据列索引提取文件夹中所有excel指定列的摘要。本文将通过各种场景分析并结合示例代码向您详细介绍。有需要的朋友可以参考一下。
00-1010前言一、场景描述二、python摘要
目录
前言
情景一:
文件夹里有很多excel数据,包含相同的数据格式。我们需要提取每个文件中指定的几列数据,并将它们汇总到一个文件中(因为它们是按列索引提取的,所以列的顺序可以不同)
汇总后:
一、情景描述
注意事项:
只能有运行文件。py和要汇总的文件放在文件所在的文件夹,不能有其他文件夹,否则会出现运行错误;第二次运行时,需要删除第一次得到的结果文件res.xlsx,否则会出现运行错误;代码如下(示例):
# -*-编码: utf-8-*-
导入操作系统
进口熊猫作为pd
#输入参数是excel表格所在的目录。
def to_one_excel(目录):
dfs=[]
#遍历文件目录并将所有表表示为pandas中的DataFrame对象。
# for root _ dir,sub _ dir,os.walk中的文件(r dir) 3360 #第一个是起始路径,第二个是起始路径下的文件夹,第三个是起始路径下的文件。
对于操作系统中的根目录、子目录、文件。Walk (dir) 3360 #第一个是起始路径,第二个是起始路径下的文件夹,第三个是起始路径下的文件。
对于文件:中的文件
if file.endswith(xlsx):
#构造一个绝对路径
文件名=os.path.join(根目录,文件)
# df=pd.read_excel(文件名)
Df _ 1=list (PD。READ _ excel (file _ name,nrows=1)) #读取excel数据的第一行并放入列表中
# excel将第一行数据返回列表
打印(文件名)
打印(类型(df_1))
打印(df_1)
#根据第一个列名获取每个文件中所需列的列索引,并返回索引值
O _ yin _ 1=df _ 1.index (people )
O _ yin _ 2=df _ 1.index(效率)
O _ yin _ 3=df _ 1.index(成就)
O _ yin _ 4=df _ 1.index (yield )
O _ yin _ 5=df _ 1.index (node )
O _ yin _ 6=df _ 1.index(备注)
#读取文件内容usecols=[1,3,4]读取列1,3,4
df=pd.read_excel(file_name,use cols=[索_yin_1,索_yin_2,索_yin_3,索_yin_4,索_yin_5,索_yin_6],sheet_name=data )
# pf=pd.read_excel(xxx.xls ,usecols=[1,3,4],sheet_name=data )
#打印(pf)
#添加数据列表,将每个文件的名称添加到该文件的数据中,确定每条数据属于哪个文件。
Excel _ name=file.replace(。xlsx , )#提取每个Excel文件的名称并移除。xlsx后缀。
Df[文件名]=excel_name #新列名为“文件名”,列数据为excel文件名
Dfs.append(df) #将新创建的文件列表追加到摘要excel中。
#行合并
df_concated=pd.concat(dfs)
#构造输出目录的绝对路径
out_path=os.path.join(dir, res.xlsx )
#输出到excel表,并删除熊猫的默认索引列
df_concated.to_excel(out_path,sheet_name=Sheet1 ,index=None)
#调用并执行函数
to _ one _ excel(r e : \ py \ python 3.7 \ test \ test 96 )
二、python汇总
分享:
固守旧我,维持现状,最大的好处就是避免改变。就像陷入了一个负能量循环。你越害怕改变,你就越没有动力去改变。
这就是关于python通过列索引提取文件夹中所有excel指定列的摘要的文章。有关python提取excel指定列的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。