网站日志剖析是网站SEO优化的重要组成部分。网站刚刚创立,咱们想看看蜘蛛是否匍匐;网站包括,咱们需求知道蜘蛛的活动;网站包括削减,咱们想看看服务器是否有问题;网站是K,咱们想看看服务器日志中的服务器是否有问题。

因而,不管网站何时运转,网站日志都应该一直重视网站服务器日志的动态。怎么剖析网站日志?咱们需求知道哪些数据?接下来,终究的SEO参谋将与您评论网站日志剖析的主题。在剖析网站日志时,咱们应该重视以下数据:

网站日志记载了蜘蛛和访客拜访网站的实际状况。这些数据对网站具有重要意义。用户行为和蜘蛛行为都有重要的参阅数据。

从用户的拜访行为,咱们能够知道用户喜爱哪个页面,他进入哪个进口,最终脱离哪个页面;他拜访了多少页面,他在网站上停留了多长时刻,这些数据非常重要。在很大程度上,它协助我了解用户的阅览行为和思维。

从蜘蛛的视点来看,一般能够调查到蜘蛛的出访次数、蜘蛛停留时刻、蜘蛛抓取量和蜘蛛回来码。咱们能够核算蜘蛛均匀停留时刻、蜘蛛均匀抓取量、蜘蛛仅有抓取量、蜘蛛重复抓取的页数;以及抓取时刻、抓取页面和特定的页面列类型。这关于网站了解网站的权重散布是非常重要的参阅。

咱们能够经过调查网站日志来剖析蜘蛛的行为。

1。蜘蛛总抓取量和均匀抓取量的添加和削减能够显现网站的结构、蜘蛛对网页的偏好程度以及蜘蛛总拜访量能够显现网站的巨细。

2。均匀网页停留时刻标明蜘蛛匍匐一页,削减网页匍匐时刻无疑对网站有重大意义。

3。仅有能够用来剖析网站是否答应蜘蛛匍匐无效页面的数据量。假如呈现这种状况,咱们应该及时处理,以防止蜘蛛的丢失。网站上也有重复匍匐的次数和蜘蛛的重复率。重复爬虫不能添加搜集的数据量,网站的总权重与排名和流量有着亲近的联系。在这种状况下,咱们应该引导蜘蛛去匍匐网站的其他页面,削减蜘蛛重复的匍匐页面。在这里咱们能够借用nofollower标签来辅佐。

4。蜘蛛捕捉时刻剖析,经过日志剖析,能够大致了解蜘蛛何时拜访你的网站,能够更好地协助你把握网站的更新时刻和规则。

5。结合网站流量趋势图,当网站流量大幅下降,网站流量反常时,需求了解剖析蜘蛛是否在同一时刻段内反常匍匐,如回来码是否正常,服务器是否安稳等。

经过以上的描绘,我以为您应该对网站日志的重要性有一个大致的了解,并对网站日志进行剖析。

咱们怎么才干简略地开端剖析日志?下面是一个简略的日志来阐明:

#软件:MicrosoftInternet信息服务6.0

版别1

#日期:2011-03-0100:00:17

#字段:日期时刻s-sitenames-ipcs-methodcs-uri-stemcs-uri-querys-portcs-usernamec-ipcs(用户署理)sc-statussc-substatussc-win32-statussc-bytes

2011-03-0102:44:37W3SVC381211.154.135.217get/news/news.aspid=20080-203.208.60.169Mozilla/5.0+(兼容;+Googlebot/2.1;++http://www.google.com/bot.html)20000029057298

查找引擎蜘蛛:

百度:百度蜘蛛谷歌:谷歌机器人msn:msnbot

yahoo:slurpyodao:youdaobotsogou:sogou+get+spider

在上面查找蜘蛛的姓名,你就能看到蜘蛛的踪影。重要的是怎么阅览下面的代码。咱们称之为HTTP状况代码。

日期表明拜访记载的日期;

时刻拜访时刻;

s-sitename代表您的虚拟主机。

S-IP访客IP;

cs办法是指拜访办法,有两种常见的办法,一种是get,即咱们一般翻开一个url拜访操作,另一种是post,提交表单操作时;

cs-uri-step是要拜访的文件。

cs-uri查询是指拜访地址参数,如asp文件?下面的字符串id=12等等,假如没有参数,使用来表明;

S端口拜访的端口

cs用户名拜访者称号

C-IP源IP

CS(用户署理)拜访源;

SC状况状况状况,200表明成功,403表明无权限,404表明404表明打不到该页面,500表明程序有错;
sc-substatus 服务端传送到客户端的字节巨细;
cs–win32-statu客户端传送到服务端的字节巨细;

声明:有的资源均来自网络转载,版权归原作者所有,如有侵犯到您的权益 请联系邮箱:123456@qq.com 我们将配合处理!

原文地址:分析网站日志应该从哪个页面入手?发布于2022-10-18 02:58:13

相关推荐