python3字符编码转换,python2和python3编码的区别

　　经朋友提醒，边肖发现有一点关于编码的基础知识，所以有些朋友对这方面含糊其辞，这让边肖有点尴尬。在得到大家的催促后，边肖立即整理了编码类型信息，内容经过精简，方便朋友阅读。在这篇文章的整理中，知识点的分析会比以前丰富一点。今天，我们将详细解释Python3中的几种编码类型和转换方法。

　　1.Python和unicode

　　为了正确处理多语言文本，Python在2.0版之后引入了Unicode字符串。

　　2.python中的print

　　虽然python内部需要将文本编码转换为unicode编码，但是终端显示是由传统的Python字符串完成的(实际上Python的print语句根本打印不出双字节Unicode编码的字符)。

　　Python的print将对输出进行unicode编码(对于其他非unicode编码，print将保持原样。

　　输出）做自动的编码转换(输出到控制台时)，而文件对象的write方法就不会做，因此，当一些字符串用print输出正常时，write到文件确不一定和print的一样。

在linux下是按照环境变量来转换的，在linux下使用locale命令就可以看到。print语句它的实现是将要输出的内容传送了操作系统，操作系统会根据系统的编码对输入的字节流进行编码。

>>>str='学习python'
　　>>>str
　　'\xe5\xad\xa6\xe4\xb9\xa0python'#asII编码
　　>>>printstr
　　学习python
　　>>>str=u'学习python'
　　>>>str####unicode编码
　　'\xe5u\xad\xa6\xe4\xb9\xa0python'

3.python中的decode

将其他字符集转化为unicode编码（只有中文字符才需要转换）

>>>str='学习'
　　>>>ustr=str.decode('utf-8')
　　>>>ustr
　　u'\u5b66\u4e60'

这样就对中文字符进行了编码转换，可用python进行后续的处理；（如果不转换的话，python会根据机器的环境变量进行默认的编码转换，这样就可能出现乱码）

4.python中的encode

将unicode转化为其它字符集

>>>str='学习'
　　>>>ustr=str.decode('utf-8')
　　>>>ustr
　　u'\u5b66\u4e60'
　　>>>ustr.encode('utf-8')
　　'\xe5\xad\xa6\xe4\xb9\xa0'
　　>>>printustr.encode('utf-8')

以上就是Python3编码的4种类型，同时带了转换的方法。如果有其他更好的方法，小编也会在后续更新出来的。本篇编码类型方面是基础的python知识，小伙伴们学习的时候一定要加强记忆。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读