浅谈网站IIS日志分析方法(图文版)


    前段时间在做9d上海搬家网时,发现网上有许多新手seoer咨询关于网站IIS日志相关信息的疑问贴。阿辉个人认为,如果你是一位seoer,那么不仅要知道网站IIS日志的概念,更应该做到能看懂网站内部所导出的每一条IIS日志信息。这样做目的就是为了让我们更直接明了的看清各类搜索引擎在我们网站浏览以后留下的痕迹,便于我们更好的进行搜索引擎优化。那么,针对网站IIS日志我们需要了解哪些内容呢?如何才能看懂每一条IIS日志信息?有经验的seoer比较清楚,想高效的学会网站IIS日志,主要从IIS日志的简介、IIS日志的重要性、IIS日志如何获取、IIS日志如何分析、IIS日志返回代码这五个方面来进行学习与掌握。只要弄懂这些东西,那么你对网站IIS日志信息将了如指掌。下面是个人对于这五个方面的浅薄认知,陈述出来与大家分享,希望在大家学习网站IIS日志相关知识时,能有所帮助。


   
1、IIS日志的概念


    新手seoer在学习网站建设和搜索引擎优化时会碰到一个概念性疑问“网站IIS日志是什么”。其实,IIS日志就是一种行为记录文件,像小学生日记一样,日记结构有时间、地点、人物、故事的起因、故事的经过以及结尾,两者区别之处在于不同人物、不同地点和不同故事。网站IIS日志又称web日志,它记录了每一个网站背后服务器每天的一些状况,如搜索引擎百度蜘蛛在某时通过某个IP进入网站访问了哪些页面,是否成功访问,返回状态是多少等。


   
2、IIS日志的重要性


    作用决定重要性。网站IIS日志包含了网站服务器的许多状况和访问IP的来源,单从记录搜索引擎访问时间、访问IP以及访问返回状况等数据显示,就给seoer展现了不少搜索引擎优化信息,为seoer优化网站权重和关键词排名提供了方向,提高网站的运营效果。目前网络营销领域内,对于一名seoer而言,每日查看网站IIS日志已成为必不可少的工作之一。


   
3、IIS日志如何获取


    接下来就是本次分享的重头戏之一,获取网站IIS日志的方法。有些朋友曾经问我,如果有ftp服务器的管理权限(ftp服务器的账号、密码、上传地址),是不是就可以拿到IIS日志了呢?实际上许多朋友都可能把虚拟主机和ftp服务器搞混淆了。我们知道,ftp服务器的权限是我们通过ftp工具和我们的虚拟空间进行连接,通过ftp这个工具,我们可以把自己的电脑与虚拟空间进行连接,进行文件的上传和下载。但是网站IIS日志需要在虚拟主机(又称空间)内部下载而来,换句话说,我们要拿到网站IIS日志,就必须要有虚拟主机(又称空间)的管理权限。

 

IIS日志如何获取


    IIS日志获取的途径主要有两种,一种就是我们自己通过虚拟主机直接获取,别外一种则是要求第三方为我们提供网站IIS日志。


    第一种途径是通过虚拟主机直接获得。在自己购买空间的时候,都需要在空间商的网站上注册一个账号和密码,那么这个资料就是虚拟主机的管理权限资料。我们要想拿到网站的iis日志,首先要登陆我们的虚拟主机管理面板,在里面找到一个叫www日志或者web日志的文件,然后会提示你下载,这一步就是把iis日志下载到我们的虚拟空间上。一般iis日志在虚拟主机上会保留4天的记录,也就是说我们至少需要四天下载一次,如果隔的时间久了,就找不到以前的日志了。


    接下来要做的就是通过ftp服务器连接我们的虚拟空间,在虚拟空间里面找到一个logfiles的文件,里面存放的就是在虚拟主机上下载的iis日志,有的空间里面有两个logofiles文件,一个是在根目录下,一个是在虚拟空间连接后直接就可以看到,一般情况下网站的iis日志都是在根目录下的logfiles里面。


    第二种途径就是要求第三方提供iis日志。在请网络公司建站的情况下,我们是很难拿到虚拟主机的管理权限的,这时候就只好要求建站方提供iis日志,这是一件很痛苦的事情。因为一些小的网络公司为了便宜,使用的空间就不提供iis日志,那么第三方也就无法为你提供iis日志了,所以我们在建站或者购买空间的时候一定要问清楚是否提供iis日志,这点很重要。


    4、IIS日志如何分析

 

IIS日志如何分析


    如果你去公司面试,面试官提问,网站IIS日志是否能看懂,你很惊愕的回答,这块我还在学习中;如果你是一名高薪的seoer,因看不懂IIS日志导致不能及时针对网站百度收录与排名下滑等问题做出正确的挽救工作而被迫请辞;如果你是一位网络创业者,数月间原本数万IP流量变成数百IP流量,只因你没有查看网站IIS日志。


    很多人也许会觉得危言耸听,然而互联网竞争并不比实际市场竞争小,你懂别人不懂,这就是你的优势,无论是应聘职位或者是自足自给,物竞天择的法则在网络里面同样可行。那么我们该如何分析网站IIS日志?请看下面这段IIS日志:


    2010-07-30 01:06:43 192.168.0.102 - W3SVC1 MGL 192.168.0.102 80 GET /css/rss.xslt - 304 0 140 358 0 HTTP/1.1 192.168.0.102 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE) ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM -


   
我们来对这段IIS日志做一个详细的解析:


    Fields:date2010-07-30\\爬行日期
    time01:06:43\\时间
    c-ip192.168.0.102\访问者(蜘蛛)ip
    cs-username-\\用户名
    s-sitenameW3SVC1\\服务器名称
    s-computernameMGL\\网站名称
    s-ip192.168.0.102\\服务器IP地址
    s-port80\\服务器端口
    cs-methodGET\\服务器收到的请求类型
    cs-uri-stem/css/rss.xslt\\文件的URL
    cs-uri-query-30401403580
    sc-status304\\协议状态(200是正常的404是找不到文件,304未改变。)
    sc-substatus0\\协议子状态
    sc-win32-status0\\win32状态
    sc-bytes140\\发送的字节数
    cs-bytes358\\接受的字节数
    time-taken0\\所用时间
    cs-versionHTTP/1.1\\协议版本
    cs-host192.168.0.102\\显示主机头的内容
    Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE)  \\用户代理,即用户所用的浏览器(这个最重要)
    cs(Cookie)ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM\\发送或接收的Cookie内容(如果有)
    cs(Referer)-\\选择该选项可以记录用户访问的前一个站点。此站点提供与当前站点的链接。


    通过上面的讲解相信你对网站IIS日志已有了较深层次的了解。由于该段IIS日志代码属于较难的日志代码,新手seoer若是能够真正理解的话,对于网站IIS日志具体分析应该不在话下了。seoer学习网站IIS日志还必须要记住两个定义,即W3C 扩展日志记录定义和IIS日志返回代码含义,只有完全记住这两种意义,结合前面的理解,那么无论是怎样的网站IIS日志,你将变得游刃有余。


   
5、IIS日志内部W3C 扩展日志记录前缀 含义和HTML返回代码


   
W3C 扩展日志记录前缀 含义


    s- 服务器操作。
    c- 客户端操作。
    cs- 客户端到服务器的操作。
    sc- 服务器到客户端的操作。


    HTML返回状态代码


    2xx 成功
    200 正常;请求已完成。
    201 正常;紧接 POST 命令。
    202 正常;已接受用于处理,但处理尚未完成。
    203 正常;部分信息 - 返回的信息只是一部分。
    204 正常;无响应 - 已接收请求,但不存在要回送的信息。
    3xx 重定向
    301 已移动 - 请求的数据具有新的位置且更改是永久的。
    302 已找到 - 请求的数据临时具有不同 URI。
    303 请参阅其它 - 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
    304 未修改 - 未按预期修改文档。
    305 使用代理 - 必须通过位置字段中提供的代理来访问请求的资源。
    306 未使用 - 不再使用;保留此代码以便将来使用。
    4xx 客户机中出现的错误
    400 错误请求 - 请求中有语法问题,或不能满足请求。
    401 未授权 - 未授权客户机访问数据。
    402 需要付款 - 表示计费系统已有效。
    403 禁止 - 即使有授权也不需要访问。
    404 找不到 - 服务器找不到给定的资源;文档不存在。
    407 代理认证请求 - 客户机首先必须使用代理认证自身。
    410 请求的网页不存在(永久);
    415 介质类型不受支持 - 服务器拒绝服务请求,因为不支持请求实体的格式。
    5xx 服务器中出现的错误
    500 内部错误 - 因为意外情况,服务器不能完成请求。
    501 未执行 - 服务器不支持请求的工具。
    502 错误网关 - 服务器接收到来自上游服务器的无效响应。
    503 无法获得服务 - 由于临时过载或维护,服务器无法处理请求。


    以上就是今天阿辉与各位seoer分享网站IIS日志注意点的全部内容,本文由idsem小组黄辉编写。请保留版权链接:http://www.idaus.com