抓取网页内容解决办法

抓取网页内容
想按照关键字抓取某网页中的内容,比如上搜狐财经里看基金的每天披露信息,我想按照其中的关键字,比如“基金代码” 抓取到基金的代码值,“管理公司”能抓取到相应的管理公司。这样的程序怎么写?用什么语言都行,谢谢大神们啦
------解决方案--------------------
1、抓取网页,c/c++可用libcurl,开源的,很好用。
2、分析抓取到的信息,网页中的信息都是有格式的,可以按照那个格式去解析数据。当然,一旦它的格式变了,你的程序也要改。解析数据要么你搞正则表达式,要么自己写类似于正则的查找算法。
------解决方案--------------------
http://blog.csdn.net/huangxy10/article/details/8120106网络爬虫
------解决方案--------------------
《数学之美》上有几章内容介绍