程序员人生
网站导航
返回首页
php框架
web前端
程序人生
php开源
数据库
服务器
互联网
联系我们
百度搜索引擎robots.txt文件说明与用法示例
栏目:
网络优化
时间:2014-03-15 18:28:30
什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
robots.txt文件放在哪里?
robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
网站 URL
相应的 robots.txt的 URL
http://www.w3.org/
http://www.w3.org/robots.txt
http://www.w3.org:80/
http://www.w3.org:80/robots.txt
http://www.w3.org:1234/
http://www.w3.org:1234/robots.txt
http://w3.org/
http://w3.org/robots.txt
我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
------分隔线----------------------------
上一篇
除了广告联盟 草根站长尚能赚钱的四种方法
下一篇
PHPWIND 7.5 门户自定义模块教程
------分隔线----------------------------
最新技术推荐
1
父子页面之间跨域通信的方法
2
对于现代开发来说,Javascript就是一种垃圾语言
3
程序员在页面友好性上常犯的5种错误以及改正方法
4
前端开发与项目管理
5
让我们再聊聊浏览器资源加载优化
6
网站不添加内容也有好的排名
7
流量劫持――浮层登录框的隐患