php中的字符串和正則表達式
一、字符串类型的特点
1、PHP是弱类型语言,其它数据类型一般都能够直接应用于字符串函数操作。
<?php
//输出345
//输出345
//先查找hello常量,若没找到,将hello看做字符串使用
?>
2、字符串能够作为“数组”,是字符的集合。
<?php
;
echo $str[0];
echo $str[1];
echo $str[2];
?>
可是字符串不是真的数组,不能使用数组的函数.如count($str)不会返回字符串长度。PHP引擎无法区分字符和数组,产生二义性。
自PHP4起。已经用花括号替代方括号。
<?php
//为保证向后兼容,方括号仍然能够使用
;
echo $str{0};
echo $str{1};
echo $str{2};
?>
3、双引號变量解析
在PHP中,当用双引號或者定界符定义字符串时,当中的变量会被解析。
<?php
);
//能够解析。可是在方括号里不能使用引號
//能够解析,用花括号包括元素,name不带引號也是能够的
//如果存在对象$square
//能够解析
//不能够解析。用花括号解决
//能够解析
?>
二、字符串输出函数
三、经常使用的字符串格式函数
PS:PHP的字符串处理函数大部分不正确源字符串做改动,而是返回新的字符串
四、正則表達式
正則表達式描写叙述了一种字符串匹配的模式,通过这个模式在特定的函数中对字符串进行匹配、查找、替换和分隔等操作。由原子、元字符和模式修正符三部分组成的文字模式。
在PHP中,有两套正则的处理函数库:PCRE和POSIX。前者以preg_前缀命名,与Perl兼容;后者以ereg_前缀命名。二者功能相似,但PCRE的效率略高。
与Perl语言兼容的正則表達式处理函数:
1、语法
1.1 定界符:在与Perl兼容的正则函数中使用模式时,必须给模式加上定界符。除了字母、数字和反斜线()之外的不论什么字符都能够作为定界符号
<?php
//下面正则合法
'/</w+/';
'|(d{3})-d|Sm';
'!^(?i)php[34]!';
'{^s+(s+)?$}';
?>
1.2 原子:原子包括了普通字符。如字母、数字;非打印字符,如空格、回车。特殊字符和元字符。如引號、*、+等。必须用””进行转义;自己定义原子表,如[apj]、[a-z]。通用字符类型。如d、D。
<?php
//以下二者等价,匹配e-mail
'/^[0-9a-zA-Z]+@[0-9a-zA-Z]+(.[0-9a-zA-Z]+){0,3}$/';
'/^w+@w+(.w+){0,3}$/';
?>
1.3 元字符:用于构建正則表達式的具有特殊含义的字符。
Perl能够使用各种元字符来搜索匹配,如*、+、?.常见的元字符例如以下
1.4 模式修正符:在正则的定界符之外使用,扩展正则在匹配、替换等方面的功能。
2.与Perl兼容的正則表達式函数
2.1 preg_match(string pattern,string subject[,array matches]):用于对字符串的查找和匹配。參数说明:
pattern是正则,subject是须要处理的字符串,可选的matches用于保存于pattern的各个子模式的匹配结果,matches[0]保存了与pattern匹配的总体内容,matches[1]保存了pattern中第一个小括号里匹配的内容,以此类推。
<?php
);
'/(http)://(www).([^./]+).(com|net|org)/i';
;
if(preg_match($pattern, $subject,$matches)){
//数组第1个元素保存整个匹配结果
//数组第2个元素保存第1个字表达式
//数组第3个元素保存第2个字表达式
//数组第4个元素保存第3个字表达式
//数组第5个元素保存第4个字表达式
}
?>
结果
preg_match_all()与preg_match()函数类似。不同的是前者会一直匹配到字符串末尾,后者在第一次匹配后就停止匹配。
2.2 preg_grep(string pattern,array iput):匹配数组中的元素,返回与正则匹配的数组单元。參数说明:
pattern是正则。input是须要匹配的数组。
<?php
'100');
'/^[a-zA-Z]+(d|.)+$/',$arr);
//输出:Array([1]=>Apache2.2.9 [2]=>MySQL5.0.51 [3]=>PHP5.2.6)
print_r($version);
?>
2.3 preg_replace(mixed pattern,mixed replacement,mixed subject[,int limit]):字符串替换。说明:
该函数会在subject中搜索与pattern的匹配项,并用replacement替换。limit用于限制匹配的次数。即替换的次数。
<?php
'/<[/!]*?[^<>]*?
/is'
;
'这个文本有<b>粗体</b>和<u>带有下划线</u>以及<i>斜体</i>';
//将全部HTML标记替换为空
//值替换前2个HTML标记
?>
2.4 preg_split(string pattern,string subject[,int limit[,int flags]]):对字符串进行切割。
说明:
函数返回一个数组。
数组元素包括subject中与pattern匹配作为边界所切割的字符串。limit含义见2.3,flags含义请參考文档。
<?php
//按任数量的空格切割字符串
);
//输出:Array([0]=>hypertext [1]=>language,[2[=>programming)
print_r($kerwords);
?>