详细罗列出各个搜索引擎蜘蛛日志及服务器常见
导读:2SEO优化IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为seo网站优化培训网站推广优化seo。
其实我们做seo网站优化的一般来说都是一个全知全能的职位,因为做优化做排名影响的因素太多了,就比如我们今天要讲的课题,日志的分析如果不会分析看不懂蜘蛛的爬行轨迹,那么在优化的过程中出现问题,就很有可能思路是错的而不自知。
IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。
一、各大搜索引擎的蜘蛛名称:
百度(Baidu)爬虫名称(Baiduspider)
谷歌(Google)爬虫名称(Googlebot)
雅虎(Yahoo)爬虫名称(YahooSlurp)
有道(Yodao)蜘蛛名称(YodaoBot)
搜狗(sogou)蜘蛛名称(sogouspider)
MSN的蜘蛛名称:msnbot
二、IIS分析:
案例日志:61.135.168.22--[11/Jan/2009:04:02:45+0800]"GET/thread-7303-1-1.htmlHTTP/1.1"2008450"-"&qu高端网站建设ot;Baiduspider(+http:-www-baidu-com/search/spider.htm)"
分析:
1、61.135.168.22是访问了是服务器IP为这个的网站.
2、11/Jan/2009:04:02:45表示蜘蛛爬行时间
3、GET/thread-7303-1-1.htmlHTTP,表示蜘蛛抓取了这个页面。
4、200状态码表示蜘蛛抓取页面成功;404表示蜘蛛抓取页面失败。
5、8450表示此次抓取了8450个字节
6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称
三、基本状态码:
200:请求已经完成,蜘蛛访问页面正常
301:已经移动,永久重定向
302:临时重定向
304:蜘蛛爬取后发现,页面没有修改
305:使用代理
400:请求错误
404:找不到页面
四、IIS详细状态码含义:
100-表示已收到请求的一部分,正在继续发送余下部分。
101-切换协议。
2XX-成功服务器成功地接受了客户端请求。(只要是2XX的状态,都表示成功)
200-确定。客户端请求已成功。
201-已创建。
202-已接受。
203-非权威性信息。
204-无内容。
声明: 本文由我的SEOUC技术文章主页发布于:2023-05-21 ,文章详细罗列出各个搜索引擎蜘蛛日志及服务器常见主要讲述蜘蛛,含义,服务器网站建设源码以及服务器配置搭建相关技术文章。转载请保留链接: https://www.seouc.com/article/seo_3415.html