Jumony.Core非常厉害的一个开源项目!

简单的说,就是解析html文档的,以前发送一个get请求获取一个页面的html文本后,想要获取里面的数据都是使用正则表达式.(非常的苦逼),

现在用这个获取就very easy! 安装的话在Nu Get上搜索Jumony.Core 下载即可.

具体介绍:http://www.cnblogs.com/Ivony/p/3447536.html

来个简单的Demo,获取博客园C#分类的所有文章标题

著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:卷猫
链接:http://anneke.cn/ArticleInfo/Detial/20
来源:Anneke.cn

namespace JumonyCoreDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            //从指定的地址加载html文档
            IHtmlDocument source = new JumonyParser().LoadDocument("http://www.cnblogs.com/cate/csharp");
            var aLinks = source.Find(".titlelnk");//按照css选择器搜索符合要求的元素
            foreach (var aLink in aLinks)
            {
                //<a>Hello</a> 获取hello 
                Console.WriteLine(aLink.InnerText());
 
                //获取 a标签和它的父节点 <h3><a>Hello</a></h3>
                Console.WriteLine(aLink.Parent());
 
                //<a>Hello</a> 获取hello 
                Console.WriteLine(aLink.InnerHtml());     
 
                //获取指定属性名的值  value和AttributeValue都可以获取,但区别是value当 当前属性对象为null时不会抛出异常
                Console.WriteLine(aLink.Attribute("href").Value());
                Console.WriteLine(aLink.Attribute("href").AttributeValue);
 
            }
            Console.ReadKey();
        }
    }
}


熟悉html css的非常容易上手,不得不说真的好用

Demo下载:https://github.com/zhenzhenkeai/JumonyCoreDemo