如何查看服务器日志进行网站分析2015年8月7日网站优化whweb,对于服务器日志的分析并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分析,都是用不到服务器日志的,而是通过流量统计工具,不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一学的。

真正意义上的网站分析是从服务器日志开始的,而且直到今天,分析服务器(也称为serverlogfile,或简称logfile)日志仍然是网站分析的重要方法。
1、服务器日志是什么?
这里的服务器指的是网站服务器(WebServer),而服务器日志跟飞机的黑匣子一样,是用来记录网站服务器的运行信息的,或者简单说,是用来记录服务器中的什么页面在什么时候被谁访问了。
简单的来说,服务器日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件。
网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录,通过网站日志可以清楚的得知用户在什么IP?什么时间?用什么操作系统?什么浏览器?什么分辨率显示器的情况下访问了你网站的哪个页面?是否访问成功?
例如,如果你访问一次我的网站:,那么一般情况下,网站服务器的日志就会记录在某时某刻来自某个IP的访问者索引了网页“/index.php”,当然,网站服务器日志还会记录其他许多内容,这些内容能够帮助我们分析网站的流量和访问者在网站上的行为。
网站分析就是从网站服务器日志开始的,谷歌网站推广或者更准确的说,网站服务器日志自诞生之日起,就是为网站分析所用的。
最早,人们可是把所有的记录都拿出来,然后导入到数据软件中去进行分析,辛苦程度自不用说;但这个痛苦的阶段不会持续太久,哪儿有痛苦,哪儿就有生意,所以网站日志分析软件就出现了,解决了很大的问题,以至于大小互联网服务提供商(ISP)们都为租用他们空间的用户提供一款免费的网站日志分析软件。
尽管如此,马海祥觉得分析网站日志一直都是一个相当不容易的事情,所以,人们不得不寻找一些更便利的方法,这样便发明了网站分析的新的数据获取方法,这是后话了。
2、服务器日志是如何产生的?

上面这个图说明了网站服务器日志是如何产生的,当用户访问一个网站的时候,事实上是访问这个网站的某一个具体的页面,我们假设这个页面叫Page1,这时,我们的这个访问行为会请求服务器中Page1的实际的文件,随之把这个文件下载到浏览器上,由于请求和下载行为都会引起服务器的响应和相应的行动,因此就有必要记录下服务器的这些行动。
你会问,为什么需要记录服务器的行动呢?原因很简单,因为我们不想让这个服务器变成“哈尔9000”啊(哈尔9000是库布里克《2001太空奥德赛》里面有了自我意识的电脑,它直接威胁到了电影中的宇航员)!外贸网站营销当然,这也只是个玩笑。
不过,其目的并无差别,就是能够通过服务器日志,对服务器的运行历史进行记录,这样当有任何异常情况发生的时候,我们都能够通过日志探寻问题发生的原因,跟记录飞机运行状态的黑匣子的作用十分类似。
3、服务器日志包含的信息
原理看起来并不复杂,不过logfile实际上并不简单,为了让logfile具有可读性,logfile并不可以按照各个网站所有者的喜好随意记录的,而是有自己的规范,W3C组织定义了serverlogfile的通用格式,而其他一些组织或者个人又根据自己的需要额外扩展了这个格式,使logfile能够比较全面地记录网站服务器进行的各种活动。
一条标准的webserverlog记录通常包含如下信息:
①、远程主机(RemoteHost)的IP地址/名字
②、登录名(LogName)和登录全名(FullName)
③、请求发生的日期(Date)
④、请求发生的时间(Time)
⑤、和标准格林威治时间的差值(GMTOffset)
⑥、请求的方法(RequestMethod)
⑦、请求的文件的地址(File)
⑧、请求遵守的协议(Protocol)
⑨、请求的状态(Status)
⑩、被请求文档的长度(Length)
4、如何分析查看服务器日志文件?
下面是一条标准的logfile记录:
202.71.113.38–-[03/Jan/2014:01:56:12+0800]"GET/
