python txt按行读取,python获取txt每一行内容
这篇课文的要点恰到好处
(1)用于读取文本文件格式的数据的函数:read_csv,read_table
1.读取带有不同分隔符的文本文件,并使用参数sep。
2.读取不带字段名(头)的文本文件,并使用参数名。
3.使用index_col索引文本文件
4.跳过文本文件阅读,使用skiprows。
5.如果数据太大,就必须逐块读取文本数据,用chunksize分块。
(2)将数据写入文本文件格式函数:to_csv
下面是一个例子。
(1)读取文本文件格式的数据集
1.1.read_csv和read_table的区别:
#read_csv默认读取逗号分隔的文件,不需要在sep中指定分隔符。
进口熊猫作为PD
PD . read _ CSV(c:(users(xiaoxiaodexiao(Python Lianxi(test 0424(data。CSV))))))
如果读取的是逗号分隔的文件而不是#read_csv,则必须在sep中指定分隔符,否则读取的是和原始文件一样的文件,数据没有分割。
进口熊猫作为PD
PD . read _ CSV(c:(users(xiaoxiaodexiao(Python Lianxi(test 0424(data . txt)))))
#请与上面的例子进行比较
进口熊猫作为PD
PD . read _ CSV(c:(users)xiaoxiaodexiao(python联戏(test 0424 (data.txt),sep=())
读取#read_table文件时,sep中必须指定分隔符,如果不指定,则读取的数据是原始文件,不进行分割。
进口熊猫作为PD
PD . read _ table(c:(users)xiaoxiaodexiao(python联戏(test 0424(数据。CSV))))))))
读取数据时必须指定#read_table分隔符。
进口熊猫作为PD
PD . read _ table(c:(users)xiaoxiaodexiao(python lianxi(test 0424(data . txt),sep=( )
2.如果在读取文本文件时没有在标题和名称中指定标题,则默认的第一行是标题。
Header=None表示数据集没有表头,默认在表头和索引中输入阿拉伯数字。
PD . read _ table(c:(users)xiaoxiaodexiao(python联戏(test 0424 (data.txt)),sep=( ,header=
您可以自定义名称中的标题。
PD . read _ table(c:(users)xiaoxiaodexiao(python联戏(test 0424 (data.txt)),sep=( ,
names=[x1 , x2 , x3 , x4 , x5]
3.将列指定为index_col中的索引,默认情况下,index _ col用阿拉伯数字指定索引。
名称=[x1 , x2 , x3 , x4 , x0]
PD . read _ table(c:(users)xiaoxiaodexiao(python联戏(test 0424 (data.txt)),sep=( ,
names=names,index_col=x0 )
4.以下示例显示了如何在skiprows中跳过与hello对应的行,然后读取其他行数据,并从第0行开始计数标题,而不管标题是否在第一行。
你可以比较并理解三个例子的不同之处。
PD . read _ CSV(c:(user(xiaoxiaodexiao(Python Lianxi(test 0424(data1 . txt)))))
名称=[x1 , x2 , x3 , x4 , x0]
PD . read _ CSV(c:(users(xiaoxiaodexiao(python lianxi(test 0424)data1 . txt),names=names,
kip行数=[ 0,3,6 ])
PD . read _ CSV(c:(users)xiaoxiaodexiao(python联西(test 0424 (data1.txt)),
kip行数=[ 0,3,6 ])
PD . read _ CSV(c:(users)xiaoxiaodexiao(python lianxi(test 0424(data1 . txt),header=None,
kip行数=[ 0,3,6 ])
5.分块读取,data1.txt中总共8行数据,按照3行块分3次,读取3次。第一次读三行数据,第二次读三行数据,第三次读一行数据。
现在请注意,分块的时候,标题不是作为第一行读的,和跳读是不一样的。对比下面两个例子就可以理解了。
chunk er=PD . read _ CSV(c:(users)xiaoxiadexiao(python lianxi(test 0424)data1 . txt)chunk size=3
对于m in chunker:
打印(镜头)m)
打印m
chunk er=PD . read _ CSV(c:(users)xiaoxiaodexiao(python lianxi(test 0424(data1 . txt)),header=None
chunksize=3)
对于m in chunker:
打印(镜头)m)
打印m
(2)用to_csv将数据写入文本格式
请注意,以data.txt为例,导出文件时也会写入索引。
data=PD . read _ table(c:(users)xiaoxiaodexiao(python lianxi(test 0424(data . txt),sep=())))
打印数据
可以通过指数=假禁止写入索引。
数据=PD。read _ table(c:(users)xiaoxiaodexiao(python联西(test 0424(数据。txt),sep=())))
数据。to _ CSV(c:(users)xiaoxiaodexiao(python联西(test 0424)out数据。txt),sep=!,索引=假)
可以指定要在列中写入的列
数据=PD。read _ table(c:(users)xiaoxiaodexiao(python联西(test 0424(数据。txt),sep=())))
数据。to _ CSV(c:(users(xiaoxiaodexiao(python联西(test 0424)out data 2。txt)sep=,索引=
columns=[a , c , d])
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。