13751284151

首页 >> 观点/动态 >> 探索网站 >> 技术支持

什么是robots.txt,网站优化里的robots.txt协议应该怎么写?

超级管理员
超级管理员 广东丰牛网络科技有限公司 发表时间:2022-04-23 23:53:33 关注度:573

导读 Guide

  Robots,顾名思义,也就是机器人,那么机器人肯定是人制造的,那么我们就要去操控它,不能让他很随意,造成不必要的麻烦。

  一下是百度给大家找的,我想大家都会百度,但是,百度的你真的就能看懂么?“ robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。robots.txt 是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

  当一个搜索机器人robots(有的叫搜索蜘蛛或者爬虫)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索引擎爬虫就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索引擎爬虫就沿着链接抓取。”

  robots.txt 文件限制抓取网络的搜索引擎爬虫对您的手机移动端网站的访问。这些搜索引擎爬虫是自动的,它们在访问任意网站的网页之前,都会查看是否存在阻止它们访问特定网页的 robots.txt 文件。(虽然某些搜索引擎爬虫可能会以不同的方式解释 robots.txt 文件中的指令,但所有正规的搜索引擎爬虫都会遵循这些指令。然而,robots.txt 不是强制执行的,一些垃圾信息发送者和其他麻烦制造者可能会忽略它。因此,我们建议对机密信息采用密码保护。)

  只有当您的网站中包含您不想让搜索引擎编入索引的内容时,才需要使用 robots.txt 文件。如果您希望搜索引擎将网站上的所有内容编入索引,则不需要 robots.txt 文件(甚至连空的 robots.txt 文件也不需要)。

  总之,为了能使用 robots.txt 文件,您必须要有对您网站的根目录的访问权限(如果您不能确定是否有该权限,请与您的网络托管商核实)。如果您没有对网站的根目录的访问权限,可以使用robots元标记来限制访问。从而控制你的机器人,控制蜘蛛爬去内容。从而使有用的内容让蜘蛛带走。减少不必要的信息泄露。


下一篇 新网站上线前要做哪些工作

消息提示

关闭