- WordPress robots.txt
- robots.txt 是搜索引擎中访问网站的时候要查看的第一个文件。
- Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。
- robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
- robots.txt文件的格式:
- User-agent: 定义搜索引擎的类型
- Disallow: 定义禁止搜索引擎收录的地址
- Allow: 定义允许搜索引擎收录的地址
- 例1.:禁止所有搜索引擎访问网站的任何部分
- User-agent: *
- Disallow: /
- 例2:淘宝不允许百度的机器人访问其网站下其所有的目录
- User-agent: Baiduspider
- Disallow: /
- 例3. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file)
- User-agent: *
- Allow:
- 例4. 禁止某个搜索引擎的访问
- User-agent: BadBot
- Disallow: /
- 例5. 允许某个搜索引擎的访问
- User-agent: baiduspider
- allow:/
- 推荐:Wordpress robots.txt
- User-agent: *
- Disallow: /wp-admin
- Disallow: /wp-includes
- Disallow: /wp-content/plugins
- Disallow: /wp-content/cache
- Disallow: /wp-content/themes
- Disallow: /trackback
- Disallow: /tag
- Disallow: /author
- Disallow: /wget/
- Disallow: /httpd/
- Disallow: /cgi-bin
- Disallow: /images/
- Disallow: /search
- Disallow: /feed
- Disallow: /feed/
- Disallow: /trackback/
- Disallow: /rss
- Disallow: /comments/feed
- Disallow: /feed/$
- Disallow: /*/feed/$
- Disallow: /*/feed/rss/$
- Disallow: /*/trackback/$