• AI搜DeepSeek-R1
    帮你解答跳转解答
收起工具时间不限所有网页和文件站点内检索
搜索工具
百度为您找到以下结果

robots协议(网络术语) - 百度百科

robots.txt 文件可应用到子网域(例如https://website.example.com/robots.txt)或非标准端口(例如http://example.com:8181/robots.txt)。 robots.txt 文件必须是采用 UTF-8 编...
播报
暂停
2024年11月13日 robots.txt 是一个文本文件,放置在网站的根目录下。它就像一份说明书,告诉搜索引擎的爬虫(也叫机器人)哪些页面可以访问,哪些页面不能访问。简单来说,它就是用...
播报
暂停
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。 当一个搜索机器人(有的叫搜索蜘蛛)访问一...
播报
暂停
robots.txt的作用 robots.txt 文件规定了搜索引擎抓取工具可以访问网站上的哪些网址,并不禁止搜索引擎将某个网页纳入索引。如果想禁止索引(收录),可以用noindex,或者给网页设置输入密码才能...
播报
暂停
2021年4月22日 Robots是站点与spider沟通的重要渠道,站点通过robots文件声明本网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。搜索引擎使用spider程序自动访问互联网上...
2017年1月17日 robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取...
播报
暂停
robots.txt中的所有用户代理均严格区分大小写。 你也可以使用通配符(*)来一次性为所有的用户代理制定规则。 举个例子,假设你想屏蔽除了谷歌以外的搜索引擎蜘蛛,下面就是做法: User-agent: *...
播报
暂停
2019年7月24日 前言搜索引擎通过网络蜘蛛抓取网页的内容,并展示在相关的搜索结果中。但是有些网页内容我们可能并不想被搜索引擎收录和索引,如管理员后台等。 我们就可以 通过 robots.txt 文...
2019年7月23日 robots.txt 文件设置规则 格式和位置 文件名必须为robots.txt(全部小写); 文件格式为 UTF-8 编码的纯文本文件; 必须放在网站根目录下,可通过 www.example.com/...
播报
暂停