python打不开csv文件,python open创建文件找不到
读取文件:数组
Codecs.open(文件路径、方法和编码)安全性
文件路径-文件路径函数
方法-打开模式,r是读,w是写,rw是读写代码。
编码-文件编码,中文文件使用utf-8.net。
python用下面的代码打开文件:指针
f=open(d:(test.txt),)w))
描述:
第一个参数是包含路径的文件名。
第二个参数是开路模式代码。
r :只读(默认。如果文件不存在,则会引发错误)
w :只写(如果文件不存在,将自动创建)。
a :附加到文件的末尾。
r :读取和写入XML
要将文件作为二进制文件打开,必须在模式后添加字符“b”。比如‘Rb’和‘WB’这样的博客
2.python读取文件f.read(size)的内容
size参数表示读取的次数,可以省略。如果省略size参数,将读取文件的所有内容。
F.readline))读取文件中的一行。f.readlines))将所有行读入数组[line1,line2,lineN]。
这种方法通常用于避免将所有文件的内容加载到内存中,从而提高效率。
3.python写文件f.write(string))
将字符串写入文件。写入后,必须在字符串后添加“\n”,然后在f.close()中关闭文件
4.文件内容的位置
F.read))读取后,文件指针到达文件末尾。再读f.read))可以看到空的内容已经读完了。如果您想重新读取所有内容,您必须将指针移动到文件的开头。
f.seek(0))。
该函数的格式如下。单位是字节(f.seek(offset,from_what)。From _ what表示读取的起始位置,offset表示从from _ what进一步移动一定的距离。例如f.seek) 10,3)
from_what的值为0表示文件的开头,也可以省略。默认值为0,这是文件的开头。下面是一个完整的例子。
f=打开(/tmp/workfile , r ))
f.write(0123456789abcdef)).
f.seek(5) #转到文件中的第6个字节
F.阅读(1))。
f.seek (-3,2 ) #转到结尾前的第3个字节
F.阅读(1))。
5.关闭文件并释放资源。文件操作完成后,请记得关闭文件f.close(),释放资源供其余程序使用。
但是,以ASCII或gbk编码格式读写文件相对简单,如下所示:
#编码=gbk
F=open(c:/intimate.txt),(r)) r表示文件打开模式,即只读模式。
s1=f.read()
s2=f.readline()).
S3=f.readlines(#阅读所有内容
f.close()
f=打开(c:/immediate . txt),(w)) w刻录文件
11f.write(S1).
12f.writelines(S2)没有writeline。
13 f.close())
F.writelines不输出换行符。
读取和写入python unicode文件:
#编码=gbk
导入代码
f=codecs . open( c:/immediate . txt , a 和 utf-8 )
F.write(u Chinese))。
S=中文
f.write(s.decode ) gbk ))
f.close()
f=codecs . open( c:/immediate . txt , R 和 utf-8 )
s=f.readlines()
f.close()
对于s中的行:
printline.encode(gbk ).
Python代码文件编码
py文件的默认代码是ASCII码。当显示中文时,ASCII码将被转换为系统的默认代码,从而导致错误。TaxError 3360非辅助字符。将编码说明添加到代码文件的第一行或第二行:
# coding=utf-8 ##用utf-8编码保存汉字
直接输入的字符串(如print Chinese 所示)将根据代码文件的编码进行处理,但有两种方法可以使用unicode编码:
S1=u 中文 #u表示以unicode模式存储信息。
S2=unicode(中文),gbk (gbk))))))。
Unicode是一个内置函数,第二个参数指示源字符串的编码格式。
Decode是包含在任何字符串中的方法,它将字符串转换为unicode格式,参数指示源字符串的编码格式。
Encode也是字符串中包含的一种方法,用于将字符串转换为参数指定的格式。
Python字符串编码
U 汉字是unicode类型,否则就是str类型。
str的编码与系统环境有关,通常是在sys.getfilesystemencoding()中获得的值
因此,要从unicode迁移到str,请使用encode方法。
从str转换成unicode,所以用decode。
例如:
# coding=utf-8 #默认的编码格式是utf-8
S=u 中文 #unicode代码的#个字符
将prints.encode(utf-8))转换为utf-8格式并输出。
print #的效果同上,只是默认直接转换成指定的代码。
个人总结:
U=u unicode代码字符”
G=u.encode(gbk) #将被转换为gbk格式。
此时print g #是乱码,因为当前环境是utf-8,所以gbk编码的字符是乱码。
Str=g. decode (gbk))。encode (utf-8)) g)以GBK编码格式读取,并转换为utf-8格式输出。
Print #正常显示中文。
安全方法:
S.decode(gbk),(ignore),encode (utf-8))以gbk代码读取。当然是看gbk码形式的字。
忽略错误的编码,将其转换为utf-8编码输出。
因为decode函数的原型是decode([encoding],[errors=strict]),所以第二个参数可以控制错误处理策略。默认参数是strict,这意味着如果出现非法字符,将抛出异常。
如果设置为忽略,非法字符将被忽略。
如果设置为替换呢?替换非法字符;
如果设置为xmlcharrefreplace,则使用XML字符引用。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。