用C和正则表达式来提取网页中的URL解决方案

用C和正则表达式来提取网页中的URL
我已经把一个网页下载保存到了文件中,但是要从中提取所有的URL,听说可以用正则表达式来实现,

但是没有用过。求提示!!

PS:在linux下的C

------解决方案--------------------
pcre正则。然后稍微了解下正则的简单使用。试试吧
------解决方案--------------------
推荐使用regtest软件测试正则表达式
------解决方案--------------------
探讨
上面是一个网上的例子,经过修改不行。。。。。。。。。。。

我的目的是,主要是从一个html文件中把所有存在的url读取出来

------解决方案--------------------
感觉用不着正则 自己写捕捉函数 用链表存储也是很好的方法~
------解决方案--------------------
探讨

引用:
上面是一个网上的例子,经过修改不行。。。。。。。。。。。

我的目的是,主要是从一个html文件中把所有存在的url读取出来

网址的形式乱七八糟,很难完全匹配完。
所以你得分析一下你那个html里面的url的规律,然后针对性的写正则去匹配读取。