python中pandas读取txt,pandas写入csv文件
使用新版本的excel,可以直接读取。
使用熊猫读取超过指定表页:
将数组作为公证人导入熊猫作为pd#默认首行会作为数据帧的标题:df=pd.read_excel(a.xlsx ,sheet_name=Sheet1)#若想把首行解析为数据,则:df=pd.read_excel(b.xlsx ,sheet_name=Sheet1 ,header=None)#若想把第2行作为标题,并忽略首行,则:df=pd.read_excel(b.xlsx ,sheet_name=Sheet1 ,header=1)若想遍历所有表页:
xl=pd .excel文件( test。xlsx )sheets=XL。工作表名称#查看工作表中工作表的所有工作表名称:打印(纸张)#纸张是字符串#读取第一个sheedf 0=XL。parse(sheets[0])#将特定的工作表读入数据帧读取一列,序号从0开始:
# 类型:熊猫。核心。系列。系列col 1=df。iloc[:0] col2=df.iloc[:1]对列表进行去重的方法:
# 返回去重后列表,不改变原列表li=[1,2,2,1,3]def Li _ distinct(Li):Li _ RES=[]for I in Li:if I not in Li _ RES:Li _ RES . append(I)return Li _ RES常用操作:
# 遍历一列li=[]for i,v in col1.items(): print(i,v) # i是行号,从0开始李。append(v)RES=Li _ distinct(Li)print( \ n .join(res))#返回第一列数据组成的列表li1=list(df.iloc[:0])res1=Li _ distinct(li1)print( \ n ).join(res1)) #也是去重后打印,效果同上面一样# 返回一个数据帧,包括三列:第一行,第一行,第2列df_new=df.iloc[:[0,0,1]]
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。