图一:新站长工具日志分析(这个分析工具还是挺实用的,大家可以自己去下载实测一下)做为网站拥有者,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎的抓取记录,还可以看到哪些网站盗链本站的哪些资源、部分死链接以及其他出错信息。其实对于我们来说,蜘蛛抓取记录和相关出错信息是我们最想关注的。哪些蜘蛛什么时间抓取了什么页面,返回的什么结果,是否正常,都可以从日志里清楚的看到。下面说说IISW3C格式日志中记录的字段及说明(一般都是选择的W3C格式日志)date:发出请求时候的日期。time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。c-ip:客户端IP地址。cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。s-sitename:服务名,服务的名称和实例的编号。putername:服务器的名称。s-ip:服务器的IP地址。s-port:为服务配置的服务器端口号。cs-method:请求中使用的HTTP方法,GET/-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。sc-substatus:协议子状态,记录HTTP子状态代码。sc-win32-status:Win32状态,记录Windows状态代码,参照文末说明。sc-bytes:服务器发送的字节数。cs-bytes:服务器接受的字节数。time-taken:记录操作所花费的时间,单位是毫秒。cs-version:记录客户端使用的协议版本,-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,。cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。cs(Referer):引用站点,即访问来源。附一:IIS日志的时间问题IIS-网站属性-网站-属性-扩展日志记录属性-常规属性-文件命名和回卷使用当地时间差别:选中:0点创建新文件,包含不完整的2天的GMT时间(完整的一天本地时间)未选中:8点创建新文件,包含完整的一天GMT时间(不完整的2天的本地时间)相同:日志的每条记录时间值均为GMT时间GMT时间解释:GMT时间就是英国格林威治时间,也就是世界标准时间,是本初子午线上的地方时,是0时区的区时,与我国的标准时间北京时间(东八区)相差8小时,即晚8小时。附二:HTTP状态代码:概括:1**:表示请求收到,继续处理2**:表示操作成功收到,分析、接受3**:表示完成此请求必须进一步处理4**:表示请求包含一个错误语法或不能完成5**:表示服务器执行一个完全有效请求失败详细代码说明:100--客户必须继续发出请求101--客户要求
网站服务器日志的字段和状态码分析 来自淘豆网m.daumloan.com转载请标明出处.