gethostbyname获得的IP地址不能用来访问,403Forbidden
用socket做个爬虫,用域名加路径可以访问,但将域名替换为gethostbyname获取到的IP地址,就不能访问了,是不是网站做了什么安全措施?既然浏览器可以访问,有什么办法让爬虫也能访问?
------解决思路----------------------需要定义Host字段
http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html
------解决思路----------------------楼上正解,如果你用IP访问,需要在HTTP协议头部加上Host字段行就可以了