帮助中心 >  技术知识库 >  云服务器 >  服务器教程 >  apache使用.htaccess文件实现屏蔽wget下载网站内容

apache使用.htaccess文件实现屏蔽wget下载网站内容

2016-03-10 16:37:36 20553

wget是一个从网络上自动下载文件的自由工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。

经发现,虽然wget遵循 robots.txt 规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家:

1. 屏蔽下载任何文件

.htaccess

1
2
3
4
5
6
SetEnvIfNoCase User-Agent "^wget" bad_bot
  Order Allow,Deny
  Allow from all
  Deny from env=bad_bot

2. 屏蔽下载部分文件

.htaccess

1
2
3
4
5
6
7
8
SetEnvIfNoCase User-Agent "^Wget" bad_bot
SetEnvIfNoCase User-Agent "^Wget/1.5.3" bad_bot
SetEnvIfNoCase User-Agent "^Wget/1.6" bad_bot
Order Allow,Deny
Allow from all
Deny from env=bad_bot

提交成功!非常感谢您的反馈,我们会继续努力做到更好!

这条文档是否有帮助解决问题?

非常抱歉未能帮助到您。为了给您提供更好的服务,我们很需要您进一步的反馈信息:

在文档使用中是否遇到以下问题:
XML 地图