慢点博客 » ◎网站 相关 » 如何写robots.txt

如何写robots.txt

网上随便看看,看到这篇文章,本来对于是不是要robots.txt没想那么多,不过先来看看,这个作者怎么写吧,他写了一个自己的robots.txt还附带了月光博客的robots.txt。

这个是作者自己的:(Disallow代表禁止抓取)

User-agent:*
#Directories(目录)
Disallow:/ADMIN/ //后台管理文件
Disallow:/SCRIPT/ //调用的SCRIPT文件,即使搜索引擎抓到了,也不读取
Disallow:/PLUGIN/ //插件目录
Disallow:/FUNCTION/ //不需抓取
Disallow:/DATA/ //数据库目录
Disallow:/CACHE/ //Zblog生成静态页的缓存目录,和正常文章基本一致,高重复
Disallow:/TEMPLATE/ //模板目录
Disallow:/CSS/ //CSS的一些调用文件目录
Disallow:/LANGUAGE/ //语言目录,不必抓取
#Files(文件)
Disallow:/login.asp //登录后台文件
Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面
Disallow:/search.asp //搜索页,无人使用的时候,就是一个空页
Disallow:/atom.xml //支持ATOM的FEED页,高重复。
Disallow:/rss.xml //支持RSS的FEED页,高重复。
Disallow:/view.asp? //后台预览文章时生成的页面

使用方法是代码复制到文本文档,去掉注释内容以及注释//前面的空格,另存为robots.txt,上传至博客根目录下就可以了。

以下是月光博客的

#
# robots.txt for williamlong
# Version 4.0.0
#
User-agent: *
Disallow: /ads/
Disallow: /function/
Disallow: /FCKeditor/
Disallow: /CACHE/
Disallow: /SCRIPT/
Disallow: /ADMIN/
Disallow: /google/ADMIN/
Disallow: /google/CACHE/
Disallow: /google/function/
Disallow: /blog/function/
Disallow: /wap.asp
Disallow: /cmd.asp
Disallow: /google/wap.asp
Disallow: /google/cmd.asp
Sitemap: http://www.williamlong.info/sitemap.xml

 

2 Comments

  1. anliu anliu 说道:
    这个之前就加上去了,还是挺有用的
  1. 花果山寨 花果山寨 说道:
    写好这个文件对收录的确会有帮助!

发表留言


点击更换验证码

无觅关联推荐,快速提升流量