青阁茶心

网站公告

欢迎来到青阁茶心网站


先有卞和慧眼识玉,

才有璞玉磨石成壁。

茶心苦涩遇水甘甜,

网络青阁知己而乐。

青阁茶心座右铭

搜索引擎爬行过程简介

发表时间:2015/01/03 00:00:00  来源:原创  作者:admin  浏览次数:678  
字体大小: 【小】 【中】 【大】
1、搜索引擎程序是通过网页之间的链接,不分昼夜的爬行来获取信息,收录标准主要由URL的权重、网站规模大小等因素决定; 2、搜索引擎进入服务器时,第一时间查看robots.txt(控制搜索引擎收录的标准)文件,如果robots.txt文件不存在,则返回404错误代码,但依然会继续爬行,如果定义了某些规则,则遵守索引。 3、建议必须有一个robot .txt文件(推荐阅读:robots.txt的写法http://seo.aizhan.com/qa/385.html)。 搜索引擎抓取数据的方式 1、垂直抓取策略:指搜索引擎顺着一条链接爬行,直到设定的任务完成。 思路如下:垂直抓取策略—A链接—A网页链接—A网页链接的链接 ,一直垂直抓取到最底。 2、平行抓取策略:指先把网页山的链接全部抓取一次,然后接着从每条链接牌型。 总结:在实际应用中,这两种策略会同时发生,抓取的深度和广度取决于页面的权重、结构和网站规模大小以及新鲜内容数量和频率,当然这里面包含了很多的seo的策略。

本站源码和一些文章收集于互联网如有侵权或其它问题请及时联系我们,以便及时处理!

张永庆的空间版权所有
copyright 2009-07-20  

( http://www.qgcxjs.com)

All rights reserved 苏ICP备13013770号

苏公网安备 32083002000040号

公众号:青阁茶心