python unicode编码转换utf-8编码,python unicode 转utf8

  python unicode编码转换utf-8编码,python unicode 转utf8

  一.字符集:

  

  ASCII-8859-1通常被称为Latin-1,向后兼容的ASCII。该字符集支持欧洲使用的一些语言,即GB2312/GBK。这是汉字国家标准码,专门用来表示汉字。是双字节码,英文字母与iso8859-1一致(兼容iso8859-1码)。其中,gbk编码既可以表示繁体字,也可以表示简体字,而gb2312只能表示简体字。gbk兼容gb2312编码。Unicode二.Unicode 与 UTF 之间的简单关系:

  

  unicode转换格式,通用传输格式utf-8 8位unicode转换格式utf-8是一种Unicode编码方式,主要用于转换Unicode数据,转换后便于存储和网络传输。

  三.Python3 中的字节串与字符串 之间的区别:

  

  Section(二进制数据,字节)字符串(Unicode代码数据,2个字节作为一个字)四.Python3 中编码:

  

  二进制-转换-字符串需要解码解码字符串-转换-二进制需要编码。encode python3的内存中使用的字符串都是unicode编码,但是网络传输或者从磁盘读取的数据是unicode编码转换过来的数据,通常可能是utf-8格式的数据。所以从网络或者从磁盘读取,实际上就是把utf-8格式的数据解码成unicode数据。相反,如果要将内存中的unicode数据存储到磁盘或网络上,则需要对unicode代码进行编码,通常可以用utf-8格式进行编码。

  UTF-8编码器是Python解释器3自带的,python2没有,所以需要手动设置:#coding:utf-8

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: