流畅的python第四章文本和字节序列学习记录

字符问题

把码位转化成字节序列的过程是编码,把字节序列转化成码位的过程是解码

把unicode字符串当成人类可读的文本,码位当成机器可读的,

将字节序列编程人类可读是解码,把字符串编码成字节序列是编码

字节概要

python内置了两种基本的二进制序列类型,python3引入的不可变的bytes类型和python2.6添加的可变bytearray类型

流畅的python第四章文本和字节序列学习记录

基本的编解码器

别依赖默认值

python2的默认编码是ascii而python3是utf-8

这章内容主要讨论unicode编码,其实觉得没什么很大的用途。就省略了,现在python3的默认编码utf-8可以支持绝大部分的编码问题,以后有遇到再说