python 写入csv 文件显示乱码,python的read_csv中文乱码
Python编码格式导致csv读取错误(csv.reader,pandas.csv_read),有很好的参考价值。希望对你有帮助。如有错误或不足之处,请不吝赐教。
目录
python编码格式导致csv读取错误。熊猫阅读csv的常见错误及其解决方法1)第一个错误2)第二个错误
python编码格式导致csv读取错误
本文记录了python小白今天遇到的这两个问题(csv.reader和pandas.csv_read):
Pandas模块“cparserror:标记数据时出错。c error:第4行需要1个字段,请参见2”错误
csv模块中的错误“行包含空字节”
今天疏忽了对数据的处理,偷懒把数据复制到xlsx保存。之后我直接把文件后缀修改成了。csv用于阅读。之后运行算法读取数据时,问题真的来了。
进口熊猫作为pd
path=water30.csv
df=pd.read_csv(路径)
注意:最后两行可以写成df=pd.read_csv(water30.csv )。
但是由于read_csv本身有很多参数(虽然这里没有用到),所以还是写成path比较好。
这将报告一个错误CPARSERERERROR 3360错误标记数据。c错误3360在第4行,SAW2中需要1个字段
我在网上查了很多解决方案。因为read_csv的参数很多,各有各的词。我在这里遇到的应该只是其中之一,但是找了很久都没有找到。直到我在这里看到,看了module _csv.c的代码后,发现文件中不可能有“\0”,所以csv文件不可能是unicode编码,而是ANSI。
直接更改后缀名称的结果是,当我单击该名称时,系统会提示我。csv打开它:
也就是说,在这里更改后缀并没有得到正确的文件格式。所以我选择了“另存为”并将文件格式改为
之后,读数不会报错。
注意:有一个未解决的问题,即。我通过“直接改后缀”得到的csv。我用记事本打开检查了一下。代码是ANSI。然后不知道为什么报错了.但问题暂时解决了。
现在读取的格式是
这是一种结构。
另外,对于:csv模块“行包含空字节”错误。上述问题的原因和解决方法是相同的,如
导入csv
csvfile=file(water30.csv , rb )
reader=csv.reader(csvfile)
对于reader:中的行
打印行
csvfile.close()
错误:错误:行包含空字节
校正后,读取的数据格式如下表所示
[1, 2, 2, 1, 2]
[1, 1, 1, 2, 2]
[1, 2, 1, 1, 1]
[1, 1, 1, 1, 2]
[1, 1, 1, 2, 2]
[1, 1, 1, 2, 2]
[0.697, 0.744, 0.634, 0.403, 0.481]
[0.46, 0.376, 0.264, 0.237, 0.149]
[1, 1, 1, 1, 1]
pandas读取csv常见错误及解决
1)第一种错误
错误提示:
pandas.errors.ParserError:标记数据时出错。c错误:在第121行需要1个字段,但看到2个
解决方法:
进口熊猫作为pd
data=pd.read_csv(inputfile,encoding=utf-8 ,header=None,sep=\t )
2)第二种错误
错误提示:
pandas.errors.ParserError:标记数据时出错。C error:从第15945行开始的字符串中的EOF
解决方法:
进口熊猫作为pd
导入csv
df=pd.read_csv(csvfile,quoting=csv。QUOTE_NONE,encoding=utf-8 )
以上个人经验,希望给你一个参考,也希望你能支持盛行的IT软件开发工作室。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。