求提取网页源代码中URL的正则表达式解决思路
求提取网页源代码中URL的正则表达式
我这里有两个:
"\"[hH][tT]{2}[pP]\\:/{2}.*?(\")"
用来获取如http://www.neusoft.com/...这样的URL。
"\"[hH][tT]{2}[pP]\\:/{2}.*?(?=((/)|(\")|(\\:)))"
用来获取如www.neusoft.com这样的URL。
但是应该不全,还有别的类型的
------解决方案--------------------
能用字符串解决的,就用字符串解决吧
我这里有两个:
"\"[hH][tT]{2}[pP]\\:/{2}.*?(\")"
用来获取如http://www.neusoft.com/...这样的URL。
"\"[hH][tT]{2}[pP]\\:/{2}.*?(?=((/)|(\")|(\\:)))"
用来获取如www.neusoft.com这样的URL。
但是应该不全,还有别的类型的
------解决方案--------------------
能用字符串解决的,就用字符串解决吧