apache使用.htaccess文件实现屏蔽wget下载网站内容
时间:2014-09-11 18:59 来源:linux.it.net.cn 作者:it
wget是一个从网络上自动下载文件的自由工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。
经发现,虽然wget遵循 robots.txt 规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家:
1. 屏蔽下载任何文件
.htaccess
1
SetEnvIfNoCase User-Agent "^wget" bad_bot
2
<Limit GET POST>
3
Order Allow,Deny
4
Allow from all
5
Deny from env=bad_bot
6
</Limit>
2. 屏蔽下载部分文件
.htaccess
1
SetEnvIfNoCase User-Agent "^Wget" bad_bot
2
SetEnvIfNoCase User-Agent "^Wget/1.5.3" bad_bot
3
SetEnvIfNoCase User-Agent "^Wget/1.6" bad_bot
4
<Files ~ "\.(html|pdf|mp3|zip|rar|exe|gif|jpe?g|png|php|jsp) $">
5
Order Allow,Deny
6
Allow from all
7
Deny from env=bad_bot
8
</files>
(责任编辑:IT)
wget是一个从网络上自动下载文件的自由工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。 经发现,虽然wget遵循 robots.txt 规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家: 1. 屏蔽下载任何文件 .htaccess
2. 屏蔽下载部分文件 .htaccess
(责任编辑:IT) |