抓取网页内容解决办法

抓取网页内容
想按照关键字抓取某网页中的内容，比如上搜狐财经里看基金的每天披露信息，我想按照其中的关键字，比如“基金代码” 抓取到基金的代码值，“管理公司”能抓取到相应的管理公司。这样的程序怎么写？用什么语言都行，谢谢大神们啦
------解决方案--------------------
1、抓取网页，c/c++可用libcurl，开源的，很好用。
2、分析抓取到的信息，网页中的信息都是有格式的，可以按照那个格式去解析数据。当然，一旦它的格式变了，你的程序也要改。解析数据要么你搞正则表达式，要么自己写类似于正则的查找算法。
------解决方案--------------------
http://blog.csdn.net/huangxy10/article/details/8120106网络爬虫
------解决方案--------------------
《数学之美》上有几章内容介绍