快捷搜索:

seo基础知识-【百乐门棋牌】网站日志/iis服务器常

作者: 互联网资讯  发布:2019-11-03

415 - 不支持的媒体类型。

[25/Mar/2015:11:21:15 +0800]

一、各大搜索引擎的蜘蛛名称:

常用网站日志分析软件有哪些?

504 - 网关超时。

一般的虚拟主机都提供日志文件,但是不同的虚拟主机系统会提供不同的LOG文件存储文件名,笔者使用的是万网的虚拟主机,日志文件存储在wwwlogs文件夹下。

好了,今天我们就给大家讲讲日志的分析与http 返回状态码的意义。

500.13-Web服务器太忙。

401.4 - 筛选器授权失败。

 

307 - 临时重定向。服务器目前从不同位置响应请求,但请求者应继续使用原有位置来进行以后的请求。

Google Adsense蜘蛛 :Mediapartners-Google 

304 - 未修改。自从上次请求后,请求的内容未修改过。

1、注意那些被频繁访问的资源

500.16 - UNC 授权凭据不正确。这个错误代码为 IIS 6.0 所专用。

如 果某些请求信息不是本站的资源,Http Code不是403就是404,但从名称分析,可能是保存数据库信息的文件,如果这些信息让别人拿走,那么攻击你的网站就轻松多了。发起这些请求的目的无 非就是扫描你的网站漏洞,通过漫无目的地扫描下载这些已知的漏洞文件,很可能会发现你的网站某个漏洞哦!通过观察,可以发现,这些请求所使用的Agent 差不多都是Mozilla/4.0、Mozilla/5.0或者libwww-perl/等等非常规的浏览器类型,以上我提供的日志格式化工具已经集成了 对这些请求的警报功能。我们可以通过禁止这些Agent的访问,来达到防止被扫描的目的,具体方法下面再介绍。

401.7 - 访问被 Web 服务器上的 URL 授权策略拒绝。这个错误代码为 IIS 6.0 所专用。

 

423 - 锁定的错误。

401.4-筛选器授权失败。

300 - 针对收到请求,服务器可执行多种操作。

4、观察访客行为

403.13 - 客户端证书被吊销。

403.1-执行访问被禁止。

403.16 - 客户端证书不受信任或无效。

200 8671

有道蜘蛛名称

请求信息,包括请求方式、所请求的资源以及所使用的协议,该语句的意思就是以GET方式,按照HTTP/1.1协议获取网页/blog/article/10.html,10html为网站上的某个页面。

202 - 已接受。

401.7–访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。

6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称

下面我们来说说这一行记录的意思:

403.19 - 不能为这个应用程序池中的客户端执行 CGI.这个错误代码为 IIS 6.0 所专用。

200-确定。客户端请求已成功。

403.14 - 拒绝目录列表。

403.6-IP地址被拒绝。

414 - 请求 URI 太长。

"GET /blog/article/10.html HTTP/1.1"

200:请求已经完成,蜘蛛访问页面正常

403.12-拒绝访问映射表。

417 - 执行失败。

为访客所使用的浏览器类型(Agent),这里记录了用户使用的操作系统、浏览器型号等信息。

404.0 - 未找到文件或目录。

客户端浏览器必须采取更多操作来实现请求。例如,浏览器可能不得不请求服务器上的不同的页面,或通过代理服务器重复该请求。

四、IIS详细状态码含义:

微软Bing蜘蛛 :msnbot/2.0b (+http://search.msn.com/msnbot.htm) 

401 - 访问被拒绝。IIS 定义了许多不同的 401 错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在 IIS 日志中显示:

200为该请求返回的状态码(Http Code),不同的状态码代表不同的意思,具体请阅读 HTTP 状态代码;8671为此次请求所耗费的流量(Size in Bytes),单位为byte

401.2 - 服务器配置导致登录失败。

 

404.3 - MIME 映射策略阻止本请求。

 

其实我们做seo网站优化的一般来说都是一个全知全能的职位,因为做优化做排名影响的因素太多了,就比如我们今天要讲的课题,日志的分析如果不会分析看不懂蜘蛛的爬行轨迹,那么在优化的过程中出现问题,就很有可能思路是错的而不自知。

Google图片搜索蜘蛛 :Googlebot-Image/1.0 

500.18 - URL 授权存储不能打开。这个错误代码为 IIS 6.0 所专用。

404.3-MIME映射策略阻止本请求。

4、200 状态码表示蜘蛛抓取页面成功;404表示蜘蛛抓取页面失败。

403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:

404:找不到页面

116.231.220.179 - - [25/Mar/2015:11:21:15 +0800] "GET /blog/article/10.html HTTP/1.1" 200 8671 "http://www.weiaipin.cn/" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:36.0)"

301:已经移动,永久重定向

307-临时重定向。
4xx-客户端错误

403.9 - 用户数过多。

500.18–URL授权存储不能打开。这个错误代码为IIS6.0所专用。

205 - 重置内容。

500-内部服务器错误。

403.12 - 拒绝访问映射表。

百乐门棋牌, 

201 - 已创建。

 

403.17 - 客户端证书已过期或尚未生效。

403.20-Passport登录失败。这个错误代码为IIS6.0所专用。

502.1 - CGI 应用程序超时。

通过观察日志中的信息,你可以看出你的网站被蜘蛛访问的频率,进而可以看出你的网站是否被搜索引擎青睐,这些都是SEO所关心的问题吧。日志格式化工具已经集成了对搜索引擎蜘蛛的提示功能。常见搜索引擎的蜘蛛所使用的Agent列表如下:

416 - 所请求的范围无法满足。

403.7-要求客户端证书。

雅虎爬虫名称(Yahoo Slurp)

403.19-不能为这个应用程序池中的客户端执行CGI。这个错误代码为IIS6.0所专用。

203 - 非权威性信息。

Alexa蜘蛛 :ia_archiver (+http://www.alexa.com/site/help/webmasters; crawler@alexa.com) 

407 - 要求进行代理身份验证。

505-HTTP版本不受支持。

403.4 - 要求 SSL.

这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。

分析:

204-无内容。

503 - 服务不可用。这个错误代码为 IIS 6.0 所专用。

401.2-服务器配置导致登录失败。

3、GET /thread-7303-1-1.html HTTP,表示蜘蛛抓取了这个页面。

附:网站日志代码大全

401.1 - 登录失败。

404.2-Web服务扩展锁定策略阻止本请求。

304:蜘蛛爬取后发现,页面没有修改

116.231.220.179

百乐门棋牌 1

为访客来源(Referer)。这一段是告诉我们访客是从哪里来到这一个网页。有可能是你的网站其他页,有可能是来自搜索引擎的搜索页等。通过这条来源信息,你可以揪出盗链者的网页。

305:使用代理

401.3-由于ACL对资源的限制而未获得授权。

500.13 - Web 服务器太忙。

202-已接受。

500.100 - 内部 ASP 错误。

403.2-读访问被禁止。

IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。

网站日志文件存放在什么地方?

405 - 用来访问本页面的 HTTP 谓词不被允许

403.17-客户端证书已过期或尚未生效。

搜狗蜘蛛名称(sogou spider)

403.8-站点访问被拒绝。

二、IIS分析:

 

505 - HTTP 版本不受支持。

401.1-登录失败。

百度爬虫名称(Baiduspider)

"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:36.0)"

200 - 确定。客户端请求已成功。

如 果在日志中,你发现某个资源(网页、图片和mp3等)被人频繁访问,那你应该注意该资源被用于何处了!如果这些请求的来源(Referer)不是你的网站 或者为空,且状态码(Http Code)为200,说明你的这些资源很可能被人盗链了,通过 Referer 你可以查出盗链者的网址,这可能就是你的网站流量暴增的原因,你应该做好防盗链了。请看下图,我网站上的japan.mp3这个文件就被人频繁的访问了, 下图还只是日志的一部分,这人极其险恶,由于我早已将该文件删除,它迟迟要不到japan.mp3,在短短一个小时内对japan.mp3发起了不下百次 的请求,见我设置了防盗链就伪造来源Referer和Agent,还不断地更换IP,很可惜它做得都是无用功,根本没有这个文件,请求的状态码Http Code都是403或者404。

403.6 - IP 地址被拒绝。

服务器由于遇到错误而不能完成该请求。

404.1 - 无法在所请求的端口上访问 Web站点。

 

204 - 无内容。

503-服务不可用。这个错误代码为IIS6.0所专用。

302:临时重定向

1、我们可以比较准确的定位搜索引擎蜘蛛来爬行我们网站的次数,可以屏蔽伪蜘蛛(此类蜘蛛多以采集为主,会增加我们服务器的开销)点此识别Baiduspider真伪 ;

206 - 部分内容。

504-网关超时。

403 - 禁止访问:IIS 定义了许多不同的 403 错误,它们指明更为具体的错误原因:

 

502.2 - CGI 应用程序出错。

如何分析网站日志中的内容?

1、61.135.168.22 是访问了是服务器IP为这个的网站.

500.12-应用程序正忙于在Web服务器上重新启动。

【来源媒体:雨中漫步网络 编译:赵慧森】

俄罗斯Yandex搜索引擎蜘蛛 :Yandex/1.01.001 (compatible; Win16; I) 

403.2 - 读访问被禁止。

302-对象已临时移动。

403.11 - 密码更改。

通 过查看格式化后的日志,可以查看跟踪某个IP在某个时间段的一系列访问行为,单个IP的访问记录越多,说明你的网站PV高,用户粘性好;如果单个IP的访 问记录希希,你应该考虑如何将你的网站内容做得更加吸引人了。通过分析访客的行为,可以为你的网站建设提供有力的参考,哪些内容好,哪些内容不好,确定网 站的发展方向;通过分析访客的行为,看看他们都干了些什么事,可以揣测访客的用意,及时揪出恶意用户。

100 - 表示已收到请求的一部分,正在继续发送余下部分。

405-用来访问本页面的HTTP谓词不被允许(方法不被允许)

案例日志:61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider(+http:-www-baidu-com/search/spider.htm)"

 

403.18 - 在当前的应用程序池中不能执行所请求的 URL.这个错误代码为 IIS 6.0 所专用。

百乐门棋牌 2

301 - 永久移动转移,请求的内容已永久移动其他新位置。

Twiceler爬虫程序 :Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)’ 

500.15 - 不允许直接请求 Global.asa.

Baidu蜘蛛 :Baiduspider+(+http://www.baidu.com/search/spider.htm) 

401.3 - 由于 ACL 对资源的限制而未获得授权。

 

本文由百乐门棋牌发布于互联网资讯,转载请注明出处:seo基础知识-【百乐门棋牌】网站日志/iis服务器常

关键词:

上一篇:没有了
下一篇:没有了