python中字符串的意思,Python字符串有哪些
对于单个字符的编码,Python提供了ord()函数来获取字符的整数表示,chr()函数将编码转换为相应的字符:
订单(“A”)
65
Ord(“中间”)
20013
人权委员会(66)
b
人权中心(25991)
如果知道字符的整数编码,也可以用十六进制写str:
u4e2d\u6587
“中文”的两种写法完全等同。
因为Python的字符串类型是str,所以在内存中用Unicode表示,一个字符对应几个字节。如果要在网络上传输或者保存到磁盘上,就需要把str换成字节中的字节。
Python字节类型的数据由带B前缀的单引号或双引号表示:
X=bABC 注意区分 ABC 和bABC 。前者是str,后者的内容和前者一样,只是bytes的每个字符只占一个字节。
相关:《Python视频教程》
Unicode表示的Str可以通过encode()方法编码成指定的字节,例如:
ABC。编码(“ascii”)
“ABC”
中国人。编码(“utf-8”)
b\xe4\xb8\xad\xe6\x96\x87
中国人。编码(“ascii”)
回溯(mostrecentcalllast):
文件 stdin ,第1行,在模块中
codeencoderror : ASCII CodecCan TencodeCharacter Position 0-13360 OrdinalNotnrange(128)纯英文str在ASCII中可以编码为字节,内容相同。包含中文字符串可以用UTF 8编码成字节。包含中文的Str不能用ASCII编码,因为中文编码的范围超过了ASCII编码的范围,Python会报错。
在字节中,不能显示为ASCII字符的字节用\x##显示。
反之,如果我们从网络或磁盘读取字节流,那么读取的数据就是字节。要将字节转换成str,需要使用decode()方法:
美国广播公司。解码(“ascii”)
ABC
b\xe4\xb8\xad\xe6\x96\x87 。解码(“utf-8”)
如果字节包含无法解码的字节,decode()方法将报告一个错误:
b\xe4\xb8\xad\xff 。解码(“utf-8”)
回溯(mostrecentcalllast):
.
CodeDecoderror 3360 UTF-8 CodecCan TDecodebyte0x ffin position :无效起始字节如果字节中只有少量无效字节,可以传入errors=ignore 来忽略错误的字节:
b\xe4\xb8\xad\xff 。解码(“utf-8”,错误=“忽略”)
Medium 要计算str包含多少个字符,可以使用len()函数:
len(“ABC”)
三
Len(“中文”)
len()函数计算str中的字符数,如果改为字节数,len()函数计算字节数:
伦(bABC )
三
len(b\xe4\xb8\xad\xe6\x96\x87 )
六
Len(“中国人”)。编码( utf-8 ))
可以看出,一个汉字经过UTF-8编码后通常占用3个字节,而一个英文字符只占用1个字节。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。