正则表达式与re模块

正则表达式

1,元字符

  .  匹配除换行符以外的任意字符

  w 匹配字母数字和下划线

  d    匹配数字

  s  匹配空白符

     匹配换行符

     匹配制表符

     匹配单词的结尾

   ^  匹配字符串的开始

  $  匹配字符串的结尾

  W  匹配非字母数字下划线

  D  匹配非数字

  S  匹配非非空白符

  ()  括号内的表达式,表示一个组

  [ ]  匹配字符组中的字符

  [^ ]  匹配除了字符组中的所有字符

2,量词

  *  重复零次或多次

  +  一次或多次

  ?  重复零次或一次

  {m}  重复m次

  {m,}  重复m次或更多次

  {m,n}  重复m到n次

3,转义符

  当我们在碰到有特殊意义的转义符,例如 ,s就需要用到转义符,“\n”,"\s",也可用r,如r" "

4贪婪匹配与惰性匹配

  .* 贪婪匹配

  .*? 惰性匹配

5,re模块的常用方法

  

1 import re
2 print(re.findall('www.(.*).com','www.baidu.com'))   #['baidu']
3 pat='www.(.*).com'
4 ret=re.search(pat,"www.baidu.com")
5 if ret:
6     print(ret.group())      #www.baidu.com
View Code