GZIP概念 GZIP最早由Jean-loup Gailly和Mark Adler创建,用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。 HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常 常使用GZIP压缩技术来让用户感受更快的速度。这一般是指WWW服务器中安装的一个功能,当有人来访问这个服务器中的网站时,服务器中的这个功能就将网 页内容压缩后传输到来访的电脑浏览器中显示出来.一般对纯文本内容可压缩到原大小的40%.这样传输就快了,效果就是你点击网址后会很快的显示出来.当然 这也会增加服务器的负载. 一般服务器中都安装有这个功能模块的. gzip 命令 减少文件大小有两个明显的好处,一是可以减少存储空间,二是通过网络传输文件时,可以减少传输的时间。gzip 是在 Linux 系统中经常使用的一个对文件进行压缩和解压缩的命令,既方便又好用。 语法:gzip [选项] 压缩(解压缩)的文件名 该命令的各选项含义如下: -c 将输出写到标准输出上,并保留原有文件。 -d 将压缩文件解压。 -l 对每个压缩文件,显示下列字段: 压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名字 -r 递归式地查找指定目录并压缩其中的所有文件或者是解压缩。 -t 测试,检查压缩文件是否完整。 -v 对每一个压缩和解压的文件,显示文件名和压缩比。 -num 用指定的数字 num 调整压缩的速度,-1 或 --fast 表示最快压缩方法(低压缩比), -9 或--best表示最慢压缩方法(高压缩比)。系统缺省值为 6。 指令实例: gzip * % 把当前目录下的每个文件压缩成 .gz 文件。 gzip -dv * % 把当前目录下每个压缩的文件解压,并列出详细的信息。 gzip -l * % 详细显示例1中每个压缩的文件的信息,并不解压。 gzip usr.tar % 压缩 tar 备份文件 usr.tar,此时压缩文件的扩展名为.tar.gz。 IIS或Apache启用GZIP压缩优化网站 先来了解一下GZIP,gzip是GNU zip的缩写,它是一个GNU自由软件的文件压缩程序,也经常用来表示gzip这种文件格式。软件的作者是Jean-loupGailly和Mark Adler。1992年10月31日第一次公开发布,版本号是0.1,目前的稳定版本是1.2.4。 gzip可以极大的加速网站.有时压缩比率高到80%,近来测试了一下,最少都有40%以上,还是相当不错的.在Apache2之后的版本,模块名不叫gzip,而叫mod_deflate 1、Apache启用gzip 如果要开启gzip的话,一定要打开下面二个模块. LoadModule headers_module modules/mod_headers. so LoadModule deflate_module modules/mod_deflate. so 设置压缩比率,取值范围在 1(最低) 到 9(最高)之间,不建议设置太高,虽然有很高的压缩率,但是占用更多的CPU资源. DeflateCompressionLevel 3 AddOutputFilter DEFLATE html xml php js css <Location /> SetOutputFilter DEFLATE BrowserMatch ^Mozilla/4 gzip-only-text/html BrowserMatch ^Mozilla/4\.0[678] no-gzip BrowserMatch \bMSIE !no-gzip !gzip-only-text/html SetEnvIfNoCase Request_URI \\.(?:gif|jpe?g|png)$ no-gzip dont-vary SetEnvIfNoCase Request_URI .(?:exe|t?gz|zip|bz2|sit|rar)$ no-gzip dont-vary SetEnvIfNoCase Request_URI .(?:pdf|mov|avi|mp3|mp4|rm)$ no-gzip dont-vary Header append Vary User-Agent env=!dont-vary #对代理的设置 </Location> 下面二个测试网站 测试数据对css Original Size: 44 KB Gzipped Size: 10 KB Data Savings: 77.27% 测试数据js Original Size: 6 KB Gzipped Size: 2 KB Data Savings: 66.67% 测试数据php Original Size: 62 KB Gzipped Size: 15 KB Data Savings: 75.81% 上面只是随机拿的几个数据,看的出来,使用了gzip压缩后文件小多了. 另外讲一下,有关squid对gzip的处理 在squid中,对同一个URL只保留一份缓存。对于如果不同browser(是否支持压缩) 如果频繁交替访问,例如:对某个cache住的目标,一个http/1.0请求可能会导致squid强制更新其缓存。但接下来的另一个http/1.1请 求又会导致squid再次更新缓存。这样那squid缓存数据就要频繁更新,这就极大的降低了cache命中率。 不过还好,现实环境中不支持压缩的browser毕竟是很少的情况,所以对于缓存命中率的降低很有限. 这个神通广大的模块就是mod_gzip.它通过用和gzip一样的压缩算法对apache发 出的页面进行压缩,可能的话可以把页面压缩成为原来大小的十份之一。哪,如果10K的页面只要传1K这不就是提速10倍嘛。当然一般网页只可以达到3-6 倍。那也很不错。对吧。连google这样一个大的网站都采用这个技术。你还不快跟上? 这样一个好东东,来来来,我告诉你如何安装:分3步,1、下载,2、修改配置,3、测试。 安装, 配置 把mod_gzip放到你的apache的源代码目录下,新建一个mod_gzip目录如果需要补丁(针对1.3.17. la版) 还需运行: patch mod_gizp.c 按你需要,在配置中选择动态DSO或静态编译进apache系统。如何处理在README中讲得很清楚,如-add-module=mod_gzip.c, make,make install等等。这里不多讲。 把下列配置加入httpd.conf尾部。 # MOD_GZIP configuration mod_gzip_on Yes mod_gzip_minimum_file_size 1002 mod_gzip_maximum_file_size 0 mod_gzip_maximum_inmem_size 60000 mod_gzip_item_include mime "application/x-httpd-php" mod_gzip_item_include mime text/* mod_gzip_item_include mime "httpd/unix-directory" mod_gzip_dechunk Yes mod_gzip_temp_dir "/tmp" mod_gzip_keep_workfiles No mod_gzip_item_include file ".php3$" mod_gzip_item_include file ".txt$" mod_gzip_item_include file ".html$" mod_gzip_item_exclude file ".css$" mod_gzip_item_exclude file ".js$" 在保存修改后运行 …/bin/apachectl configtest确保配置修改无误。 然后用 apachectl restart 指令重起服务。 修改,测试 在宣布做好了之前在测试一下是优秀程序员的习惯。为了尽量不影响你的用户的浏览,我们可以用把新的apache驱动在8080端口上或者用指令控制mod_gzip起作用的目录,而不是一下子全用mod_gzip. 用法如下: MOD_GZIP configuration 没有问题后你就可以让你的用户很开心的发现’XX网站现在好快哦。’ Mod_gzip真的很神奇,100K的HTML大 文档只要12K就可以传到用户端了。越先采用这个技术你的用户对你的网站的高速度印象就越深。不过有所得必有所失,由于解压是在客户端进行的,效果和用户 的浏览器有一定关系。 2、IIS启用gzip 现代的浏览器IE6和Firefox都支持客户端Gzip,也就是说,在服务器上的网页,传输 之前,先使用Gzip压缩再传输给客户端,客户端接收之后由浏览器解压显示,这样虽然稍微占用了一些服务器和客户端的CPU,但是换来的是更高的带宽利用 率。对于纯文本来讲,压缩率是相当可观的。如果每个用户节约50%的带宽,那么你租用来的那点带宽就可以服务多一倍的客户了。 IIS6已经内建了Gzip压缩的支持,可惜,没有设置更好的管理界面。所以要打开这个选项,还要费些功夫。 首先,如果你需要压缩静态文件(HTML),需要在硬盘上建一个目录,并给它“IUSR_机器 名”这个用户的写权限。如果压缩动态文件(PHP,asp,aspx)就不需要了,因为它的页面是每次都动态生成的,压缩完就放弃。然后在IIS管理器 中,“网站”上面右键-属性,不是下面的某个站点,而是整个网站。进入“服务”标签,选上启用动态内容压缩,静态内容压缩。 然后选中网站下面那个服务器扩展,新建一个服务器扩展。名字无所谓,下面的添加文件的路径是: c:\windows\system32\inetsrv\gzip.dll,然后启用这个扩展。 这时候静态内容是可以压缩的,但是对于动态内容,aspx文件却不在压缩范围内。因为默认的可压缩文件并没有这个扩展名。而管理界面中你又找不到可以增加扩展名的地方,这时候只能去修改它的配置文件了。 在 c:\windows\system32\inetsrv\下面有个MetaBase.xml文件,可以用记事本打开,找到 IIsCompressionScheme,有三个相同名字的段,分别是deflate,gzip,Parameters,第三段不用管它,前两段有基本 相同的参数,在这两段的参数HcScriptFileExtensions下面都加上一行aspx,如果你有其它的动态程序要压缩,也加在这里。HcDynamicCompressionLevel改成9,(0-10,9是性价比最高的一个)。 用Nginx的gzip模块提升网站访问效率 Nginx自带的有gzip模块,这个模块支持在线实时压缩输出数据流。经过良好的配置优化,可以大幅的提升网站的输出效率。 效果显而易见。 指令 [#gzip gzip] [#gzip_buffers gzip_buffers] [#gzip_comp_level gzip_comp_level] [#gzip_min_length gzip_min_length] [#gzip_http_version gzip_http_version] [#gzip_proxied gzip_proxied] [#gzip_types gzip_types] gzip 语法: gzip on|off 默认值: gzip off 作用域: http, server, location, if (x) location 开启或者关闭gzip模块 gzip_buffers 语法: gzip_buffers number size 默认值: gzip_buffers 4 4k/8k 作用域: http, server, location 设置系统获取几个单位的缓存用于存储gzip的压缩结果数据流。例如 4 4k 代表以4k为单位,按照原始数据大小以4k为单位的4倍申请内存。 4 8k 代表以8k为单位,按照原始数据大小以8k为单位的4倍申请内存。 如果没有设置,默认值是申请跟原始数据相同大小的内存空间去存储gzip压缩结果。 gzip_comp_level 语法: gzip_comp_level 1..9 默认值: gzip_comp_level 1 作用域: http, server, location gzip压缩比,1 压缩比最小处理速度最快,9 压缩比最大但处理最慢(传输快但比较消耗cpu)。 gzip_min_length 语法: gzip_min_length length 默认值: gzip_min_length 0 作用域: http, server, location 设置允许压缩的页面最小字节数,页面字节数从header头中的Content-Length中进行获取。 默认值是0,不管页面多大都压缩。 建议设置成大于1k的字节数,小于1k可能会越压越大。即: gzip_min_length 1024 gzip_http_version 语法: gzip_http_version 1.0|1.1 默认值: gzip_http_version 1.1 作用域: http, server, location 识别http的协议版本。由于早期的一些浏览器或者http客户端,可能不支持gzip自解 压,用户就会看到乱码,所以做一些判断还是有必要的。注:21世纪都来了,现在除了类似于百度的蜘蛛之类的东西不支持自解压,99.99%的浏览器基本上 都支持gzip解压了,所以可以不用设这个值,保持系统默认即可。 gzip_proxied 语法: gzip_proxied [off|expired|no-cache|no-store|private|no_last_modified|no_etag|auth|any] ... 默认值: gzip_proxied off 作用域: http, server, location Nginx作为反向代理的时候启用,开启或者关闭后端服务器返回的结果,匹配的前提是后端服务器必须要返回包含"Via"的 header头。 off - 关闭所有的代理结果数据的压缩 expired - 启用压缩,如果header头中包含 "Expires" 头信息 no-cache - 启用压缩,如果header头中包含 "Cache-Control:no-cache" 头信息 no-store - 启用压缩,如果header头中包含 "Cache-Control:no-store" 头信息 private - 启用压缩,如果header头中包含 "Cache-Control:private" 头信息 no_last_modified - 启用压缩,如果header头中不包含 "Last-Modified" 头信息 no_etag - 启用压缩 ,如果header头中不包含 "ETag" 头信息 auth - 启用压缩 , 如果header头中包含 "Authorization" 头信息 any - 无条件启用压缩 gzip_types 语法: gzip_types mime-type [mime-type ...] 默认值: gzip_types text/html 作用域: http, server, location 匹配MIME类型进行压缩,(无论是否指定)"text/html"类型总是会被压缩的。 注意:如果作为http server来使用,主配置文件中要包含文件类型配置文件 http{ include conf/mime.types; ......} 如果你希望压缩常规的文件类型,可以写成这个样子 http { include conf/mime.types; gzip on;: gzip_min_length 1000; gzip_buffers 4 8k; : gzip_http_version 1.1; gzip_types text/plain application/x-javascript text/css text/html application/xml; ...... } 扩展阅读: · 1 网页GZip压缩在线检测:http://www.usemm.com/tool/gzip/index.php · 2 GZIP优化:http://www.fovweb.com/optimizer/iis-or-apache-web-enabled-optimize-gzip-compression/ · 3 http://www.math.ecnu.edu.cn/~jypan/linux/command/gzip.htm (责任编辑:IT) |