• Nginx error

    日期:

    前端访问403就知道是拒绝访问,但是具体那块拒绝不清楚,通过访问nginx的error日志发现如下错误: 2012/09/03 18:31:22 [error] 11132#0: *4550288 open() /home/statistic/tomcat_statistic_*******/webapps/statistic/stat.js failed (13: Permission deni...

  • Nginx手动编译的编译选项解析

    日期:

    管理操作系统肯定要面临装软件,Linux有很多种装软件的办法,而手动编译是最通用的办法。Nginx是一款非常优秀的Web服务器/反向代理服务器,具有轻量、占用资源少、支持高并发等优秀特点。正因为Nginx有着高效、多功能的特性,Nginx的编译安全的选项也是非常...

  • 在Apache服务器日志中查看蜘蛛记录的方法

    日期:

    问 :使用Apache服务器,如何查看哪些网站的蜘蛛来爬过自己的网站或者哪些IP访问过我们的网站呢? 答 :通过Apache服务器的访问日志记录! Apache服务器的访问日志名称在linux下默认叫做access_log,在windows下是access.log文件 如何配置 :在httpd.conf文...

  • 设置Apache日志记录蜘蛛爬行

    日期:

    1、打开httpd.conf文件找到以下部分:LogFormat %h %l %u %t \%r\ %s %b \%{Referer}i\ \%{User-Agent}i\ combined LogFormat %h %l %u %t \%r\ %s %b common LogFormat %{Referer}i - %U referer LogFormat %{User-agent}i agent 具体有关LogFormat的用法请...

  • 让Apache拒绝网络流氓蜘蛛

    日期:

    一旦网站对外开放,并登陆到搜索引擎中,网络蜘蛛会定期来光顾采集。 当一个网络蜘蛛(有的叫搜索机器人)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那...

  • apache日志只记录Baidu蜘蛛的记录

    日期:

    Apache默认的日志记录方式: LogFormat %h %l %u %t \%r\ %s %b common 记录到的如下: 61.135.168.14 - - [22/Oct/2008:22:13:11 +0800] GET / HTTP/1.1 200 8427 Apache还有个较复杂的combined的日志记录方式,如下: LogFormat %h %l %u %t \%r\ %s %b \%...

  • apache日志应用设置

    日期:

    一、apache日志按日期记录 在apache的配置文件中找到 ErrorLog logs/error_log CustomLog logs/access_log common Linux系统配置方法: 将其改为 ErrorLog | /usr/local/apache/bin/rotatelogs /home/logs/www/%Y_%m_%d_error_log 86400 480 CustomLog | /us...

  • Linux下通过Apache日志监测百度蜘蛛的爬行记录

    日期:

    1. 百度蜘蛛爬行的次数 cat access.log | grep Baiduspider+ | wc 最左面的数值显示的就是爬行次数。 2. 百度蜘蛛的详细记录(Ctrl+C可以终止) cat access.log | grep Baiduspider+ 也可以用下面的命令: cat access.log | grep Baiduspider+ | tail -n 10 ca...

  • Apache屏蔽YisouSpider(一搜蜘蛛\神马)的方法

    日期:

    最近网站被YisouSpider(一搜蜘蛛)频繁抓取导致服务器几乎瘫痪,而这个垃圾的一搜却没带来一个ip访问。对于这种垃圾蜘蛛应当采取屏蔽的做法。以下分享本人屏蔽YisouSpider(一搜蜘蛛)的方法: 1.在网站日志中查看YisouSpider(一搜蜘蛛)的ip 2.利用服务器屏蔽Yis...

  • Apache日志分析百度蜘蛛抓取情况及百度蜘蛛IP段列表对应分析

    日期:

    根据不同的IP我们可以分析网站是个怎样的状态, 以下常见的百度蜘蛛IP: 123.125.68.*这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。 220.181.68.*每天这个IP 段只增不减很有可能进沙盒或K站。 220.181.7.*、123.125.66.* 代表百度蜘蛛IP...