Python核心编程读笔 5: python的序列

第六章 序列:字符串、列表、元组

一、序列

(1)序列类型操作符

  seq[ind] 获得下标为 ind 的元素

  seq[ind1:ind2] 切片操作

  seq * expr   序列重复 expr 次

  seq1 + seq2   连接序列

  obj in seq   判断 obj 元素是否包含在 seq 中

  obj not in seq   判断 obj 元素是否不包含在 seq 中
(2)内建函数

类型转换(工厂)函数:

  list(iter) 把可迭代对象转换为列表

  str(obj) 把 obj 对象转换成字符串(对象的字符串表示法)

  unicode(obj) 把对象转换成 Unicode 字符串(使用默认编码)

  basestring() 抽象工厂函数,其作用仅仅是为 str 和 unicode 函数提供父类,所以不能被实例化,也不能被调用

  tuple(iter) 把一个可迭代对象转换成一个元组对象
操作函数:

  enumerate(iter)  接受一个可迭代对象作为参数,返回一个 enumerate 对象(同时也是一个迭代器),该对象生成由 iter 每个元素的 index 值 和 item 值组成的元组(PEP 279)
  len(seq) 返回 seq 的长度
  max(iter,key=None) or max(arg0,arg1...,key=None)  返回 iter 或(arg0,arg1,...)中的最大值,如果指定了 key, 这个 key 必须是一个可以传给 sort()方法的,用于比较的回调函数
  min(iter, key=None) or min(arg0, arg1.... key=None)  返回 iter 里面的最小值;或者返回(arg0,arg2,...)里面的最小值;若指定了 key,这个 key 必须是一个可以传给 sort()方法的,用于比较的回调函数
  reversed(seq)  接受一个序列作为参数,返回一个以逆序访问的迭代器
  sorted( iter, func=None, key=None, reverse=False )  接受一个可迭代对象作为参数,返回一个有序的列表;可选参数 func,key 和 reverse 的含义跟 list.sort()内建函数的参数含义一 样.
  sum(seq, init=0)  返 回 seq 和 可 选 参 数 init 的 总 和 , 效果等同于reduce(operator.add,seq,init)
  zip([it0, it1,... itN])  返回一个列表,其第一个元素是 it0,it1,...这些元素的第一个元素组成的一个元组,第二个...,类推.

二、字符串

1 字符串操作符

  索引操作符:

    正向索引

    反向索引:索引从-1开始,向字符串开始的方向计数!

   

  成员操作符:

    in

    not in

  

   格式化操作符%

  

   字符串模板

     举例:

      >>> from string import Template
      >>> s = Template('There are ${howmany} ${lang} Quotation Symbols')
      >>> print s.substitute(lang='Python', howmany=3)
      打印出:

        There are 3 Python Quotation Symbols

   原始字符串操作符(r/R):

      >>> ' '
      ' '
      >>> r' '
      '\n'

      

      >>> print ' '
      

      >>> print r' '
      

2 内建函数

    cmp()

    len()

    max() 和 min()

    enumerate():

      >>> s='foobar'

      >>> for i, t in enumerate(s):

        print i, t

      0 f

      1 o

      ...

    zip():

      >>> s, t = 'foa', 'obr'
      >>> zip(s, t)
      [('f', 'o'), ('o', 'b'), ('a', 'r')]
    

    isinstance():

      >>>isinstance( 'hello world', str )

      True  

      >>>isinstance( 'hello world', unicode )

      False

    chr(),unichr(),ord():

      chr() 整数做参数,返回对应的ASCII字符

      unichr() 整数做参数,返回对应的unicode字符

      ord() 是上面两个函数的配对函数,反作用

    

    字符串类型内建函数:

      string.capitalize() 把字符串的第一个字符大写

      string.center(width) 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串

      string.count(str, beg=0, end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数

      string.decode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式解码 string,如果出错默认报一个ValueError的异常,除非errors指定的是 'ignore'或者'replace'         

      string.encode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式编码 string,如果出错默认报一个 ValueError 的异常,除非 errors 指定的是'ignore'或者'replace'

      string.endswith(obj, beg=0, end=len(string))  检查字符串是否以 obj 结束,如果 beg 或者 end 指定则检查指 定的范围内是否以 obj 结束,如果是返回 True,否则返回 False.     

      string.expandtabs(tabsize=8)把字符串 string 中的 tab 符号转为空格, 默认的空 格数 tabsize 是 8.

      string.find(str, beg=0, end=len(string)) 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围, 则检查是否包含在指定范围内,如果是返回开始的索引值,否则 返回-1

      string.index(str, beg=0, end=len(string)) 跟 find()方法一样,只不过如果 str 不在 string 中会报一个异常.

      string.isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False

      string.isalpha()  如果 string 至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False

      string.isdecimal() 如果 string 只包含十进制数字则返回 True 否则返回 False.

      string.isdigit() 如果 string 只包含数字则返回 True 否则返回 False.

      string.islower() 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分 大小写的)字符都是小写,则返回 True,否则返回 False

      string.isupper() 如果 string 中包含至少一个区分大小写的字符, 并且所有这些(区分 大小写的)字符都是大写,则返回 True,否则返回 False

      string.isnumeric() 如果 string 中只包含数字字符,则返回 True,否则返回 False

      string.isspace() 如果 string 中只包含空格,则返回 True,否则返回 False.

      string.istitle() 如果 string 是标题化的(见 title())则返回 True,否则返回 False

      string.join(seq) Merges (concatenates)以 string 作为分隔符,将 seq 中所有的元素 (的字符串表示)合并为一个新的字符串

      string.ljust(width) 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串

      string.lower() 转换 string 中所有大写字符为小写.

      string.upper() 转换 string 中的小写字母为大写

      string.lstrip() 截掉 string 左边的空格

      string.partition(str) 有点像 find()和 split()的结合体,从str出现的第一个位置起, 把string分成一个3元素的元组(string_pre_str,str,string_post_str),若string中不包含str则string_pre_str == string.

      string.replace(str1, str2, num=string.count(str1)) 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次.

      string.rfind(str, beg=0,end=len(string))  类似于 find()函数, 不过是从右边开始查 找.

      string.rindex( str, beg=0,end=len(string)) 类似于 index(), 不过是从右边开始.

      string.rjust(width)返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串

      string.rpartition(str)  类似于 partition()函数,不过是从右边开始查找.

      string.rstrip()  删除 string 字符串末尾的空格.

      string.split(str="", num=string.count(str)) 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num 个子字符串

      string.splitlines(num=string.count(' ')) 按照行分隔, 返回一个包含各行作为元素 的列表, 如果 num 指定则仅切片 num 个 行.

      string.startswith(obj, beg=0,end=len(string))  检查字符串是否是以 obj 开头,是则 返回 True,否则返回 False。如果 beg 和 end 指定值,则在指定范围内检查

      string.strip([obj]) 在 string 上执行 lstrip()和 rstrip()

      string.swapcase() 翻转 string 中的大小写

      string.title() 返回"标题化"的 string,就是说所有单词都是以大写开始,其余 字母均为小写(见 istitle())

      string.translate(str, del="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 del 参数中

      string.zfill(width) 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充 0

  

3 字符串的独特特性

  (1)三引号

    Python 的三引号就是为了解决这个问题的, 它允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符:

      >>> hi = '''hello 

      ... there'''

      >>> hi

      'hi there'

  (2)字符串不变性

    因为python解释器替你管理内存,所以你根本不需要知道底层发生了什么,每次当你修改一个字符串或者改变字符串内容时,python都会为你分配一个新串

4 Unicode

三、列表

1 列表基础

  创建: aList = [1,2,3,'abc']

  访问:下标或切片

  更新:下标、append()追加

  删除列表元素:del aList[1]、 remove(某个元素值)、pop() 

2 操作符

标准类型操作符:

  > < ==

序列类型操作符:

  下标、切片:list[1]、list[1:3]

  成员关系操作:in、not in

  连接操作符:+

    等效果函数:extend():

      两种方式的区别在于+实际上是新建了一个列表而extend()函数是把新列表添加到原有的列表里面了

  重复操作符:*

  注:python的列表也支持符合赋值操作符

列表类型操作符和列表解析:

  >>>[ i*2 for i in [8,-2,5] ]

  [16,-4,10]

  >>>[ i for i in range(8) if i%2==0 ]

  [0,2,4,6]

3 内建函数

  cmp()

  len()

  max() min()

  sorted() reversed()

    例子 :

      >>> s = ['They', 'stamp', 'them', 'when', "they're", 'small']

      >>> sorted(s)
      ['They', 'small', 'stamp', 'them', "they're", 'when']
      解释:字符串排序使用的是字典序,而非字母序(字母'T'的ASCII码值比字母'a'靠前)

  enumerate() 和 zip()

    >>> albums = ['tales', 'robot', 'pyramid']
    >>> for i, album in enumerate(albums):
    0 tales

    1 robot

    2 pyramid

  sum()

  list() 和 tuple(): 列表和元组之间的转换函数

4 列表类型的内建函数

  list.append(obj) 向列表中添加一个对象 obj

  list.count(obj) 返回一个对象 obj 在列表中出现的次数

  list.extend(seq) 把序列 seq 的内容添加到列表中

  list.index(obj, i=0, j=len(list)) 返回 list[k] == obj 的 k 值,并且 k 的范围在 i<=k<j;否则 引发 ValueError 异常.

  list.insert(index, obj) 在索引量为 index 的位置插入对象 obj.

  list.pop(index=-1)a 删除并返回指定位置的对象,默认是最后一个对象

  list.remove(obj) 从列表中删除对象 obj

  list.reverse() 原地翻转列表

  list.sort(func=None,key=None,reverse=False) 以指定的方式排序列表中的成员,如果 func 和 key 参数指定, 则按照指定的方式比较各个元素,如果 reverse 标志被置为 True,则列表以反序排列.

四、元组

 1 元组基础

  创建:aTuple = (1,2,'abc')

  访问: 下标、切片

  更新:元组同字符串一样是不可变类型!不能更新或者改变元组的元素,只能构造一个新元组

  删除:不能删除元组元素,但可以重组或者再造!

2 操作符和内建函数

  创建,重复*,连接+,in not in,切片, < > ==

  len() max() min() cmp() list() tuple() str()

3 元组的特殊特性

(1)元组也不是那么地“不可变”

  虽然元组对象本身是不可变的,但这并不意味着元组包含的可变对象也不可变了:

  >>> t = (['xyz', 123], 23, -103.4)
  >>> t
  (['xyz', 123], 23, -103.4)
  >>> t[0][1]
  123
  >>> t[0][1] = ['abc', 'def']
  >>> t
  (['xyz', ['abc', 'def']], 23, -103.4)


(2)默认集合类型
  >>> 'abc', -4.24e93, 18+6.6j, 'xyz'
  ('abc', -4.24e+093, (18+6.6j), 'xyz')

(3)单元组元组

  创建一个只有一个元素的元组是行不通的:

  >>> ('xyz')
  'xyz'
  >>> type(('xyz')) # a string, not a tuple
  <type 'str'> #是一个字符串而非一个元组 !

  因为:由圆括号包裹的一个单一元素首 先被作为分组操作,而不是作为元组的分界符
(4)字典的关键字

  不可变对象的值是不可改变的。这就意味着它们通过 hash 算法得到的值总是一个值。这是 作为字典键值的一个必备条件。键值必须是可哈希的对象,元组变量符合此标准,而列表变量不行

五、深拷贝与浅拷贝

序列类型对象的浅拷贝是默认类型拷贝,并可以以下几种方式实施:

  (1)完全切片操作[:],

  (2) 利用工厂函数,比如 list(),dict()等,

  (3)使用 copy 模块的 copy 函数.

深拷贝:需要copy.deepcopy()函数!

几点关于拷贝操作的警告

   第一:非容器类型(比如数字,字符串和其他"原子"类型的 对象,像代码,类型和 xrange 对象等)没有被拷贝一说,浅拷贝是用完全切片操作来完成的.

   第二:如果元组变量只包含原子类型对象,对它的深拷贝将不会进行