pandas合并多个csv文件,pandas分块写入csv
Pandas是Python语言的扩展库,它提供了高性能、易于使用的数据结构和数据分析工具。下面这篇文章主要介绍如何使用熊猫快速拆分大型csv文件的相关信息。有需要的可以参考一下。
00-1010前言1。操作步骤1.1安装pandas1.2拆分大文件2。多了解一点2.1熊猫看完csv文件返回什么类型?2.2如何从数据帧中读取某一行?2.3如何从数据帧中读取多行?2.4如何从数据帧中读取列?2.5如何用熊猫读写CSV文件?2.6关于pandas3。摘要
目录
本文介绍了如何使用pandas快速拆分大型CSV文件。
前言
1. 操作步骤
pip安装熊猫
1.1 安装pandas
进口熊猫作为pd
#读取csv文件
df=pd.read_csv(./super _ big . CSV’)
#获取文件总数。
行编号=长度(df)
#确定每个小文件中包含的数据量
步长=400
对于起始范围(0,row_num,step):
停止=开始步骤
文件名=。/small_{}-{}。csv。格式(开始、停止)
d=df[开始:停止]
print(保存文件: 文件名,数据大小: 字符串(len(d)))
d.to_csv(fname,index=None)
#输出如下所示
#保存文件:/small_0-500.csv,数据大小: 500
#保存文件:/small_500-1000.csv,数据大小: 500
代码就是这么简单。
1.2 拆分大文件
2. 再多了解一点儿
进口熊猫
df=pandas.read_csv(。/super _ big . CSV’)
类型(df)
类 pandas.core.frame.DataFrame
2.1 pandas读取csv文件后,返回的是什么类型?
#回到第一行
print(df.loc[0])
#回到第二行
print(df.loc[1])
2.2 如何从DataFrame中读取某一行呢?
d=df[开始:停止]
2.3 如何从DataFrame读取多行呢?
数据={
姓名 : [彼得,罗斯,乔],
职业 : [教师,工程师,博士]
}
df=pd。数据帧(数据)
打印(df[名称])
#0彼得
#1玫瑰
#2乔
#Name:名称,dtype:对象
2.4 如何从DataFrame中读取某一列呢?
df=PD . read _ CSV( YOUT _ CSV _ file . CSV )
df.to_csv(fname,index=None)
注意:index默认为True,这意味着保存行索引。这时候就需要一个例子了。
数据={
姓名 : [彼得,罗斯,乔],
职业 : [教师,工程师,博士]
}
df=pd。数据帧(数据)
df.to_csv(a.csv )
#文件的内容如下。请注意,行索引会自动添加到每一行的开头,从0开始递增。
,姓名,职业
0,彼得,老师
1、罗斯,工程师
2、乔医生
2.5 如何用pandas读写CSV文件?
Pandas是一款快速、强大、灵活、易用的开源数据分析和操作工具,基于Python编程语言构建。用的时候说好。
2.6 关于pandas
其实熊猫里面有很多处理csv文件的方法,非常强大。只是数据分割,有很多方法。必要的时候可以看看证件。
关于如何使用Panda快速拆分大型csv文件的文章到此结束。关于用熊猫拆分csv文件的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。