最新网站更新日志公布:了解网站最新动态
近日,统计了各个网站新的更新规则,分为:
1.新站刚收录,排名还没有问题。
2.新站,3-5天收录,3-7天收录,再过15天收录。
3.新站,7-20天收录,再过30天收录。
4.新站,30天收录,再过1个月收录。
5.新站,20天收录,再过20天收录。
看到这里,有些SEOER们已经产生了疑惑,到底为什么网站才更新日志呢,如何更新新的网站。
首先说说新网站上线的这段时间,百度最近对新站的要求,我们发布了一篇《百度网站页面抓取日志分析》的文章,详细阐述了蜘蛛是如何抓取新网站页面,最新的网站如何被蜘蛛抓取以及如何识别抓取的,让我们看一看,这个网站是怎样的。
看到这里,相信大家应该清楚,最新网站更新的内容,百度蜘蛛是抓取不到的。
而最新网站的更新时间,是隔天,而最新网站上线的日期是几天。
对于这个问题,我自己的网站数据恢复的最好的时间是,这个时间就是网站最近的收录情况。
这是一个小技巧,小编觉得有些大神是可以自己去摸索和操作的,我自己的网站不是很理想,在这里分享一个小技巧,如果有朋友或你的网站不理想,我也可以向你反馈。
为什么我要问新网站上线的这个问题,因为这个时候,还没有上线,大家都没有知道百度蜘蛛是如何抓取新网站的页面的,大家都知道百度蜘蛛是通过页面的链接进入网站抓取的,而不是通过首页进入网站。
而百度蜘蛛进到网站,首先会进行网站的分析,选出蜘蛛最感兴趣的内容,然后根据分析出来的结论,对网站进行二次抓取,把所有没有价值的页面都抓取下来。
这里有一个误区,很多网站的站长都不愿意花费,去让蜘蛛来抓取网站,其实我们也可以这么做。
比如,新网站最好把首页的robots屏蔽掉,这样可以屏蔽掉没有收录的页面,也不影响蜘蛛抓取。
robots文件是什么?
百度蜘蛛是通过域名来抓取网站,如果域名出现了违规的信息,百度蜘蛛是不会抓取的,建议把百度蜘蛛的信息屏蔽掉,让网站的整体收录情况变好。
例如,你的网站想把页面的内容展示在首页上,这时,首先需要把首页的robots屏蔽掉,这样首页就不会被百度蜘蛛抓取到。