Skip to main content

介绍

# 字符编码本质是二进制数据与语言文字的一一对应关系。
# unicode:兼容万国语言
# UTF-8:对不同的字符用不同的长度来表示,编码英文时一个字节编码一个英文字符,编码中文时三个字节编码一个中文字符
# GBK:编码中文时是用双字节来编码一个中文字符的
# encode编码:本质就是将字符转换成字节流(二进制数据流)
a = 'hello'
b = b'hello' # 二进制的字符串
print(type(a))
print(b)
print(type(b)) # <class 'bytes'> 字节码,也即字节流
    <class 'str'>
b'hello'
<class 'bytes'>
a = 'sixstar'
print(a)
a1 = a.encode() # 给a进行编码,把字符串转换成二进制数据流
print(a1)
print(type(a1))

# 解码的本质:将字节流解析为字符(还原字符串)
a2 = a1.decode() # 注意:编码和解码的方式必须一致
print(a2)
print(type(a2))
    sixstar
b'sixstar'
<class 'bytes'>
sixstar
<class 'str'>