与spider沟通渠道:robots

来源:设计经验分享网
添加时间:2024年02月
摘要:

robots是站点与spider沟通的重要渠道,站点通过robots文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

robots文件往往放置于根目录下,包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL,orNL作为结束符),每一条记录的格式如下所示:
":"

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:
User-agent:该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的Disallow和Allow行的限制。

Disallow:该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。"Disallow:"说明允许robot访问该网站的所有url,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。

Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url。
"*"匹配0或多个任意字符
"$"匹配行结束符。

较后需要说明的是:百度会严格遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写,百度会对robots中所写的文件和您不想被抓取和收录的目录做—有效匹配,否则robots协议无法生效。

以上内容由科技(深圳网站设计,深圳网站制作)为您提供,更多精彩内容:http://www.xazcit.com/

 

平面设计相关资讯推荐阅读:


深圳网页设计如何选择页面颜色深圳网页制作告诉您网页建设对于网页排名的注意事项有哪些 网页设计该怎么做怎样设计出满意的网页高端的网页建设对企业有什么好处网页上线之前要完善的工作有哪些网络商务信息收集成功网页设计师的七大必备技能广州网建-什么办法让你的网页在搜索里再次名列前茅传统商业模式是否适应互联网市场深圳福田大型网页建设,为什么网页都需要做Https协议的认证有什么好处深圳旅游网页建设哪家公司好网页选择服务器技巧和考虑因素网页建设中新站的雷区网页设计其实是一种艺术网页设计过程中应该如何设计元素网页建设与设计中如何对图片进行优化手机APP开发要找谁解析搜索史上最大迁徙,HTTP到HTTPS做竞品筛选,明确真正的竞争对手网页优化:如何提升网页访问速度深圳福田企业网页外链建设有哪些技巧构建网页时必备的好多个重特大关键点在网页设计开发中应该注意“留白”怎么样建立网页这些步骤直接教会你网页建设教大家如何快速的获取用户喜爱定制化网页设计的优点介绍建设符合W3C标准的网页 企业网页设计联系方式深圳企业建站这两大元素较易忽略对号入座!您的网页搭建有专业性吗APP动效设计必备知识危害网页实际效果的关键指标网页改版都要注重哪些因素网页建设-链接较重要 靠谱的网页设计模板制作专业定制深圳企业网页建设中客户会提及哪些要求网页建设如何合理优化TAG标签内容丰富且创意提高网页客户粘性深圳企业网页建设的空间选择问题外贸网页建设时要考虑哪些因素传统电脑网页和手机网页的不一样如何做好网页设计企业应该如何制作设计酒店网页建设网页建设的三个基本因素2021年网页建设要知道的一些规则网页设计是做什么的,网页内容如何做更有吸引网页建设中“常见问题”怎么设计分享几点黑帽SEO优化的核心技术深圳网页建设公司之提升UI设计师技能深圳网页建设设计师如何实现预期和目标怎样的网页建设才能获取到流量呢深圳福田网页建设,网页建设大概需要多少钱网页建设完成后维护的意义是什么什么是https协议企业怎样挑选自己建网页必须做什么事儿植树节预热!如何在网页设计中使用绿色网页建设与企业的发展有效的网页建设可以带来哪些影响网页建设时如何选择服务器建设高端品牌网页有什么好处
网站备案号:豫ICP备2024041165号