python字符编码使用什么编码,python字符串编码
Python 字符编码简记
可以简单理解为:
1.为了处理英文字符,产生了ASCII码。
2.为了处理汉字,产生了GB2312。
3.Unicode是为了处理各国文字而产生的。
4.为了提高Unicode的存储和传输性能,UTF-8应运而生,它是Unicode的一种实现形式。
注意:
Python2.x的默认编码是ASCII
Python3.x的默认编码是unicode,所以Python3.x直接支持中文,不需要二次处理。
相关:《Python视频教程》
GBK转换成 UTF-8 的流程:
1.通过解码转换为Unicode。
2.通过编码转换为GBK
乱码是由于系统代码和提供的字符代码不一致造成的。所以当我们需要操作系统正确输出一个字符时,不仅要知道字符的字符编码,还要知道自己的系统使用的字符编码。
大多数Linux系统使用UTF-8编码,而Windoors系统使用GB2312编码。
可以通过chardet判断字符的编码。
安装步骤:
1.下载chardet-3.0.4.tar.gz
地址:https://pypi.python.org/pypi/chardet/3.0.4#downloads
2.解压缩到安装目录
我的电脑是d : software python 2.7 lib site-packages chard et-3 . 0 . 4
3.打开Windows命令行窗口进行安装,并输入源目录。
使用python setup.py install进行安装。
测试
#-*-编码:utf-8-*-
importchardet
Name=你好
打印(chardet.detect(name))运行结果:
在py2中
#-*-coding:UTF-8-*-声明这句话是告诉python2.7解释器(默认ACSII编码方式)去解释它。py文件声明以下内容按照utf8编码,即编码(编码成一个字节串,最后转换成0101供机器执行)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。