python中的编码格式有哪些,python 编码类型

  python中的编码格式有哪些,python 编码类型

  本文介绍了Python常用编码的区别,对大家的学习或工作有一定的参考价值。有需要的朋友下面和边肖一起学习。

  Python2内容默认采用ascii编码,而Python3内容默认采用utf-8编码。这个编码问题也不是Python的问题。所有的语言都有乱码,所以今天我就和大家聊聊这四种常见的代码。

  主要有以下几个编码:

  1、ASCII

  ASCII码是一个字节编码的,所以它的范围基本上只有英文字母、数字和一些特殊符号,只有256个字符。

  2、Unicode

  俗称通用码,把所有语言统一成一个代码,解决了ascii码限制和乱码的问题。

  Unicode一般用两个字节表示一个字符,特别不常用的用四个字节表示一个字符。

  3、UTF-8

  出现了一个新问题。如果统一成unicode编码,乱码问题从此消失。但是如果你写的文本基本都是英文,那么使用Unicode编码比ascii编码要多花两倍的存储空间,非常不方便存储和传输。

  Utf-8因其应用而产生。这是一种“可变长度编码方法”。如果是英文字符,就用ascii编码,占一个字节。如果是常用汉字,占用3个字节,如果是生僻字,占用4~6个字节。

  4、GBK

  GBK只用于汉字编码。GBK的全称是《汉字内码扩展规范》,采用双字节编码。

  在介绍完以上四种之后,下面贴出五种常用代码的对比,以便更直观的了解这些代码的区别。

  关于Python通用编码的差异,本文到此结束。希望对大家的学习有所帮助,也希望大家能支持盛行的IT软件开发工作室。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: