程序员人生网站导航

百度搜索引擎robots.txt文件说明与用法示例

栏目：网络优化时间：2014-03-15 18:28:30

什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时，会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件，这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt，在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

请注意，仅当您的网站包含不希望被搜索引擎收录的内容时，才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容，请勿建立robots.txt文件。

robots.txt文件放在哪里?
robots.txt文件应该放置在网站根目录下。举例来说，当spider访问一个网站（比如http://www.abc.com）时，首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件，如果Spider找到这个文件，它就会根据这个文件的内容，来确定它访问权限的范围。

网站 URL	相应的 robots.txt的 URL
http://www.w3.org/	http://www.w3.org/robots.txt
http://www.w3.org:80/	http://www.w3.org:80/robots.txt
http://www.w3.org:1234/	http://www.w3.org:1234/robots.txt
http://w3.org/	http://w3.org/robots.txt

我在robots.txt中设置了禁止百度收录我网站的内容，为何还出现在百度搜索结果中？

------分隔线----------------------------

上一篇 除了广告联盟草根站长尚能赚钱的四种方法

下一篇 PHPWIND 7.5 门户自定义模块教程

------分隔线----------------------------

最新技术推荐

1父子页面之间跨域通信的方法 2对于现代开发来说，Javascript就是一种垃圾语言 3程序员在页面友好性上常犯的5种错误以及改正方法 4前端开发与项目管理 5让我们再聊聊浏览器资源加载优化 6网站不添加内容也有好的排名 7流量劫持――浮层登录框的隐患