做位一名SEO工作者,网站日志和对日志代码的了解是比较基础的,很多时候我们会从中间发现或分析一些现象,这对于网站的发展进度和以后的操作流 程,乃至网站下一步情况的预测,都是非常有帮助的,下面我们将网站日志及其中的HTTP状态码说明下,希望能解决一些在SEO工作中遇见的常见问题。
网站日志是什么?
网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件。
网站日志有什么作用?
通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
对于Seoer而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个搜索引擎的蜘蛛机器人在哪天访问了网站多少次,访问了哪 些页面,以及访问页面时返回的HTTP状态码,了解这些对网站在搜索引擎的情况会了解的比较清楚些,也有利于我们SEO工作的计划和展开。
网站日志如何查看?
网站日志一般存放在虚拟主机的logfiles文件夹下,有些主机的日志文件存放的文件夹可能会不太一样,但一般都包含log这个词,具体文件夹可 以咨询你的主机商或自己在主机目录下查找即可,找到日志文件后,我们可以通过FTP工具将网站日志下载下来,通过txt文档方式查看。
日志代码
通常情况下,我们将HTTP状态码叫做日志代码,下面是一些常见的日志代码和相应的注释。
1xx-信息提示:这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。
100-继续
101-切换协议
2xx-成功:这类状态代码表明服务器成功地接受了客户端请求。
200-确定,客户端请求已成功
201-已创建
202-已接受
203-非权威性信息
204-无内容
205-重置内容
206-部分内容
3xx-重定向:客户端浏览器必须采取更多操作来实现请求。例如,浏览器可能不得不请求服务器上的不同的页面,或通过代理服务器重复该请求。
301-对象已永久移走,即永久重定向
302-对象已临时移动
304-未修改
307-临时重定向
4xx-客户端错误:发生错误,客户端似乎有问题。例如,客户端请求不存在的页面,客户端未提供有效的身份验证信息。400-错误的请求。
401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示。
401.1-登录失败
401.2-服务器配置导致登录失败
401.3-由于ACL对资源的限制而未获得授权
401.4-筛选器授权失败
401.5-ISAPI/CGI应用程序授权失败
401.7–访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用
403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:
403.1-执行访问被禁止
403.2-读访问被禁止
403.3-写访问被禁止
403.4-要求SSL
403.5-要求SSL128
403.6-IP地址被拒绝
403.7-要求客户端证书
403.8-站点访问被拒绝
403.9-用户数过多
403.10-配置无效
403.11-密码更改
403.12-拒绝访问映射表
403.13-客户端证书被吊销
403.14-拒绝目录列表
403.15-超出客户端访问许可
403.16-客户端证书不受信任或无效
403.17-客户端证书已过期或尚未生效
403.18-在当前的应用程序池中不能执行所请求的URL(这个错误代码为IIS6.0所专用)
403.19-不能为这个应用程序池中的客户端执行CGI(这个错误代码为IIS6.0所专用)
403.20-Passport登录失败(这个错误代码为IIS6.0所专用)
404-未找到。
404.0-(无)–没有找到文件或目录
404.1-无法在所请求的端口上访问Web站点
404.2-Web服务扩展锁定策略阻止本请求
404.3-MIME映射策略阻止本请求
405-用来访问本页面的HTTP谓词不被允许(方法不被允许)
406-客户端浏览器不接受所请求页面的MIME类型
407-要求进行代理身份验证
412-前提条件失败
413–请求实体太大
414-请求URI太长
415–不支持的媒体类型
416–所请求的范围无法满足
417–执行失败
423–锁定的错误
5xx-服务器错误:服务器由于遇到错误而不能完成该请求。
500-内部服务器错误
500.12-应用程序正忙于在Web服务器上重新启动
500.13-Web服务器太忙
500.15-不允许直接请求Global.asa
500.16–UNC授权凭据不正确(这个错误代码为IIS6.0所专用)
500.18–URL授权存储不能打开(这个错误代码为IIS6.0所专用)
500.100-内部ASP错误
501-页眉值指定了未实现的配置
502-Web服务器用作网关或代理服务器时收到了无效响应
502.1-CGI应用程序超时
502.2-CGI应用程序出错
503-服务不可用(这个错误代码为IIS6.0所专用)
504-网关超时
505-HTTP版本不受支持
网站日志怎么看?
有了网站日志文件和相应的日志代码注释,我们就可以对网站的日志文件进行查看,下面用一段日志文件来说明下:
主机环境介绍:操作系统:Linux、Web服务器:Nginx0.8、Php版本:Php5+、Mysql版本:5.0+
日志文件:
[05/Aug/2010:10:05:14 +0800] “GET /bbs/thread-229-1-1.html HTTP/1.1″ 200 6844 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)” “-”
220.181.7.26
释义:
05/Aug/2010:10:05:14 +0800:访问日期与端口号码
GET /bbs/thread-229-1-1.html:抓取“ /bbs/thread-229-1-1.html”文件
HTTP/1.1:HTTP协议,版本为1.1
200 6844:抓取成功,抓取字节数为6844字节
Baiduspider:蜘蛛代码,这里是百度蜘蛛
220.181.7.26:蜘蛛IP地址
另外,网站日志中还清楚的记录了浏览者的一些访问记录:IP地址、访问时间、访问页面及文件、返回的http状态码、浏览器及版本等等信息,但一般 这都不是我们了解的重点,比如用户访问出现了404代码,我们只需要做好404错误页面就可以了,其他可以不用去分析,因为网站都安装有统计工具,我们在 网站的统计工具中可以很直观的看见用户行为。
作者博客:http://www.scseoer.com/web-log-code.html