nofollow属性学习札记

nofollow属性学习笔记
一什么是nofollow?
nofollow 是一个HTML标签的属性值,告诉搜索引擎“不要追踪此网页上的链接”或不要追踪此特定链接。比如说,如果网页A

有一个链接指向网页B,
<a href = "www.B.com" rel = "follow">
,则搜索引擎不把A网页计算入B网页的反向链接。什么是反向

链接?比如,A网页指向B网页,A->B,那么对B来说,这个链接就是反向链接。
二nofollow的历史
nofollow一开始应用在网页级的标记中,指定搜索引擎不要追踪网页上的任何出站链接。如果我们要把他应用在单独的连接上就

要将链接重定向至robots.txt中的拦截网站。

什么是robots.txt(也称爬虫协议),它是搜索引擎中访问网站的时候第一个要查看的文件,robot.txt文件告诉蜘蛛程序在服务器

上什么文件可以被查看。

什么是蜘蛛程序?我们可以理解其为一个专门检索网络信息的程序,它象蜘蛛一样爬来爬去。网络蜘蛛是通过网页的链接地址来

寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻

找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛

就可以用这个原理把互联网上所有的网页都抓取下来。但是这种抓取往往是不可能的,我们一般只抓取那些重要的网页。有两种

抓取方式,深度和广度,这里就不再赘述。

这样我们就引入了rel属性nofollow属性值,而无需指示搜索引擎漫游器不要追踪该网页的所有链接,只需轻松地指示蜘蛛不要抓

取某特定链接即可。例如:<a
 href="signin.php" rel="nofollow">signin</a>。


三为什么要有nofollow?
反向链接是搜索引擎给网站排名的重要因素,有很多SEO欺骗者会在其他网站大量发布带有指向自己网站链接的内容,这些垃圾链

接的存在就给搜索引擎对网页质量的评估造成一定程度的影响,可以说nofollow属性就是一个很好的垃圾链接防火墙。