python字符串转utf8编码,python更改编码方式为utf-8
python中的代码可以相互转换,这一点我们在上一篇文章中讨论过。然后边肖开始提问,如何转换utf-8编码?可能有些朋友对这个词印象比较模糊。但如果提到unicode编码,大家都会觉得很熟悉。所以今天我们讨论的是unicode中的utf-8。我们来试试两种不同编码的区别,可能会有新的惊喜。
Utf-8编码将一个unicode字符编码成1~6个字节,常见英文字母编码成1个字节,中文字符通常编码成3个字节,只有罕见字符编码成4~6个字节。注意unicode到utf-8并不是直接对应,而是通过一些算法和规则进行转换。
让我们来看看具体的编码示例:
列表(。编码( utf-8 )
[228,184,173]
列表( a 。编码( utf-8 ))
[97]可以看出,utf-8将汉字‘中’编码为三个字节,将英文字母‘A’编码为一个字节,utf-8编码兼容ASCII编码。
扩展:unicode编码
给每种语言都制定一套编码方法是很愚蠢的!为什么所有语言的所有字符不能一起编码?
把所有语言统一成一套代码,就是unicode编码。使用unicode编码,无论处理什么文本,都不会出现乱码问题。
Unicode编码使用两个字节(16位)来表示一个字符,远程字符需要四个字节。
但是新的问题又来了。如果一段纯英文文本用unicode存储,占用的空间是ASCII的两倍!存储和传输都是浪费!
今天utf-8编码转换的讲解到这里就结束了。不知道朋友们掌握了没有~边肖可以看一遍,代码真的很简单。后续还会有新的类似资料片,边肖会及时更新。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。