正则表达式中元字符运用

正则表达式中元字符使用
正则表达式中元字符的使用:
元字符: 是一些在正则表达式里面有这特殊含义的字符。要想匹配元字符本身,特通过转义。

	[].\()等都是元字符。

元字符的使用:

1. 匹配空白字符即需要对那些在原始文本里的非打印空白字符进行匹配的情况。 如找出所有的制表符/换行符等等。这些字符很难被直接输入到一个

正则表达式但是可以使用下面的特殊元字符来输入:

[\b]  回退(并删除)一个字符即Backspae键

\f  换页符

\n  换行符

\r  回车符

\t  制表符Tab键

\v  垂直制表符


小例子: 找出原始文本中空白行

注意: a. \r\n是windows 所使用的文本行结束标签; Unix/Linux 系统只是用一个换行符来结束一个文本行即它用\n标示文本行的结束;

       b. 所以同时使用与Windows 和Unix/Linux 系统的正则表达式应该包含一个可选的\r和一个必须匹配的\n。

\r\n\r\n     \n\n

一般来说需要匹配\r、\n和\t等空白字符的情况比较多见,其它使用甚少。


2.匹配特定的字符类别

\d 匹配任何一个数字字符(等价于[0-9])
\D 匹配任何一个非数字字符(等价于[^0-9])

\w 匹配任何一个字母或下划线字符(等价于[A-Za-z_])
\W 匹配任何一个非字母,或非下划线([^A-Za-z_])

\s 匹配任何一个空白字符(等价于[\f\n\t\v\r])
\S 匹配任何非空白字符等价于[^\f\n\t\v\r])