当前位置: > Linux教程 > linux基础 >

gzip 的HTTP支持

时间:2015-01-02 20:07来源:linux.it.net.cn 作者:IT

GZIP概念

  GZIP最早由Jean-loup Gailly和Mark Adler创建,用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。 

  HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常 常使用GZIP压缩技术来让用户感受更快的速度。这一般是指WWW服务器中安装的一个功能,当有人来访问这个服务器中的网站时,服务器中的这个功能就将网 页内容压缩后传输到来访的电脑浏览器中显示出来.一般对纯文本内容可压缩到原大小的40%.这样传输就快了,效果就是你点击网址后会很快的显示出来.当然 这也会增加服务器的负载. 一般服务器中都安装有这个功能模块的.

gzip 命令

  减少文件大小有两个明显的好处,一是可以减少存储空间,二是通过网络传输文件时,可以减少传输的时间。gzip 是在 Linux 系统中经常使用的一个对文件进行压缩和解压缩的命令,既方便又好用。 

  语法:gzip [选项] 压缩(解压缩)的文件名 

  该命令的各选项含义如下: 

  -c 将输出写到标准输出上,并保留原有文件。 

  -d 将压缩文件解压。 

  -l 对每个压缩文件,显示下列字段: 

  压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名字 

  -r 递归式地查找指定目录并压缩其中的所有文件或者是解压缩。 

  -t 测试,检查压缩文件是否完整。 

  -v 对每一个压缩和解压的文件,显示文件名和压缩比。 

  -num 用指定的数字 num 调整压缩的速度,-1 或 --fast 表示最快压缩方法(低压缩比), 

  -9 或--best表示最慢压缩方法(高压缩比)。系统缺省值为 6。 

  指令实例: 

  gzip * 

  % 把当前目录下的每个文件压缩成 .gz 文件。 

  gzip -dv * 

  % 把当前目录下每个压缩的文件解压,并列出详细的信息。 

  gzip -l * 

  % 详细显示例1中每个压缩的文件的信息,并不解压。 

  gzip usr.tar 

  % 压缩 tar 备份文件 usr.tar,此时压缩文件的扩展名为.tar.gz。

IIS或Apache启用GZIP压缩优化网站

   先来了解一下GZIP,gzip是GNU zip的缩写,它是一个GNU自由软件的文件压缩程序,也经常用来表示gzip这种文件格式。软件的作者是Jean-loupGailly和Mark Adler。1992年10月31日第一次公开发布,版本号是0.1,目前的稳定版本是1.2.4。 

  gzip可以极大的加速网站.有时压缩比率高到80%,近来测试了一下,最少都有40%以上,还是相当不错的.在Apache2之后的版本,模块名不叫gzip,而叫mod_deflate 

  1、Apache启用gzip

  如果要开启gzip的话,一定要打开下面二个模块. 

  LoadModule headers_module modules/mod_headers. so 

  LoadModule deflate_module modules/mod_deflate. so 

  设置压缩比率,取值范围在 1(最低) 到 9(最高)之间,不建议设置太高,虽然有很高的压缩率,但是占用更多的CPU资源. 

  DeflateCompressionLevel 3 

  AddOutputFilter DEFLATE html xml php js css 

  <Location /> 

  SetOutputFilter DEFLATE 

  BrowserMatch ^Mozilla/4 gzip-only-text/html 

  BrowserMatch ^Mozilla/4\.0[678] no-gzip 

  BrowserMatch \bMSIE !no-gzip !gzip-only-text/html 

  SetEnvIfNoCase Request_URI \\.(?:gif|jpe?g|png)$ no-gzip dont-vary 

  SetEnvIfNoCase Request_URI .(?:exe|t?gz|zip|bz2|sit|rar)$ no-gzip dont-vary 

  SetEnvIfNoCase Request_URI .(?:pdf|mov|avi|mp3|mp4|rm)$ no-gzip dont-vary 

  Header append Vary User-Agent env=!dont-vary #对代理的设置 

  </Location> 

  下面二个测试网站 

  测试数据对css 

  Original Size: 44 KB 

  Gzipped Size: 10 KB 

  Data Savings: 77.27% 

  测试数据js 

  Original Size: 6 KB 

  Gzipped Size: 2 KB 

  Data Savings: 66.67% 

  测试数据php 

  Original Size: 62 KB 

  Gzipped Size: 15 KB 

  Data Savings: 75.81% 

  上面只是随机拿的几个数据,看的出来,使用了gzip压缩后文件小多了. 

  另外讲一下,有关squid对gzip的处理 

  在squid中,对同一个URL只保留一份缓存。对于如果不同browser(是否支持压缩) 如果频繁交替访问,例如:对某个cache住的目标,一个http/1.0请求可能会导致squid强制更新其缓存。但接下来的另一个http/1.1请 求又会导致squid再次更新缓存。这样那squid缓存数据就要频繁更新,这就极大的降低了cache命中率。 

  不过还好,现实环境中不支持压缩的browser毕竟是很少的情况,所以对于缓存命中率的降低很有限. 

  这个神通广大的模块就是mod_gzip.它通过用和gzip一样的压缩算法对apache发 出的页面进行压缩,可能的话可以把页面压缩成为原来大小的十份之一。哪,如果10K的页面只要传1K这不就是提速10倍嘛。当然一般网页只可以达到3-6 倍。那也很不错。对吧。连google这样一个大的网站都采用这个技术。你还不快跟上? 

  这样一个好东东,来来来,我告诉你如何安装:分3步,1、下载,2、修改配置,3、测试。  

  安装, 配置

  把mod_gzip放到你的apache的源代码目录下,新建一个mod_gzip目录如果需要补丁(针对1.3.17. la版) 还需运行: 

  patch mod_gizp.c 

  按你需要,在配置中选择动态DSO或静态编译进apache系统。如何处理在README中讲得很清楚,如-add-module=mod_gzip.c, make,make install等等。这里不多讲。 

  把下列配置加入httpd.conf尾部。 

  # MOD_GZIP configuration 

  mod_gzip_on Yes 

  mod_gzip_minimum_file_size 1002 

  mod_gzip_maximum_file_size 0 

  mod_gzip_maximum_inmem_size 60000 

  mod_gzip_item_include mime "application/x-httpd-php" 

  mod_gzip_item_include mime text/* 

  mod_gzip_item_include mime "httpd/unix-directory" 

  mod_gzip_dechunk Yes 

  mod_gzip_temp_dir "/tmp" 

  mod_gzip_keep_workfiles No 

  mod_gzip_item_include file ".php3$" 

  mod_gzip_item_include file ".txt$" 

  mod_gzip_item_include file ".html$" 

  mod_gzip_item_exclude file ".css$" 

  mod_gzip_item_exclude file ".js$" 

  在保存修改后运行 

  …/bin/apachectl configtest确保配置修改无误。 

  然后用 apachectl restart 指令重起服务。 

  修改,测试 

  在宣布做好了之前在测试一下是优秀程序员的习惯。为了尽量不影响你的用户的浏览,我们可以用把新的apache驱动在8080端口上或者用指令控制mod_gzip起作用的目录,而不是一下子全用mod_gzip. 

  用法如下: 

  MOD_GZIP configuration 

  没有问题后你就可以让你的用户很开心的发现’XX网站现在好快哦。’ 

  Mod_gzip真的很神奇,100K的HTML大 文档只要12K就可以传到用户端了。越先采用这个技术你的用户对你的网站的高速度印象就越深。不过有所得必有所失,由于解压是在客户端进行的,效果和用户 的浏览器有一定关系。 

  2、IIS启用gzip

  现代的浏览器IE6和Firefox都支持客户端Gzip,也就是说,在服务器上的网页,传输 之前,先使用Gzip压缩再传输给客户端,客户端接收之后由浏览器解压显示,这样虽然稍微占用了一些服务器和客户端的CPU,但是换来的是更高的带宽利用 率。对于纯文本来讲,压缩率是相当可观的。如果每个用户节约50%的带宽,那么你租用来的那点带宽就可以服务多一倍的客户了。 

  IIS6已经内建了Gzip压缩的支持,可惜,没有设置更好的管理界面。所以要打开这个选项,还要费些功夫。 

  首先,如果你需要压缩静态文件(HTML),需要在硬盘上建一个目录,并给它“IUSR_机器 名”这个用户的写权限。如果压缩动态文件(PHP,asp,aspx)就不需要了,因为它的页面是每次都动态生成的,压缩完就放弃。然后在IIS管理器 中,“网站”上面右键-属性,不是下面的某个站点,而是整个网站。进入“服务”标签,选上启用动态内容压缩,静态内容压缩。 

  然后选中网站下面那个服务器扩展,新建一个服务器扩展。名字无所谓,下面的添加文件的路径是: 

  c:\windows\system32\inetsrv\gzip.dll,然后启用这个扩展。 

  这时候静态内容是可以压缩的,但是对于动态内容,aspx文件却不在压缩范围内。因为默认的可压缩文件并没有这个扩展名。而管理界面中你又找不到可以增加扩展名的地方,这时候只能去修改它的配置文件了。 

  在 c:\windows\system32\inetsrv\下面有个MetaBase.xml文件,可以用记事本打开,找到 IIsCompressionScheme,有三个相同名字的段,分别是deflate,gzip,Parameters,第三段不用管它,前两段有基本 相同的参数,在这两段的参数HcScriptFileExtensions下面都加上一行aspx,如果你有其它的动态程序要压缩,也加在这里。HcDynamicCompressionLevel改成9,(0-10,9是性价比最高的一个)。

用Nginx的gzip模块提升网站访问效率

  Nginx自带的有gzip模块,这个模块支持在线实时压缩输出数据流。经过良好的配置优化,可以大幅的提升网站的输出效率。 

  效果显而易见。

指令

   [#gzip gzip] [#gzip_buffers gzip_buffers] [#gzip_comp_level gzip_comp_level] [#gzip_min_length gzip_min_length] [#gzip_http_version gzip_http_version] [#gzip_proxied gzip_proxied] [#gzip_types gzip_types]

gzip

  语法: gzip on|off

  默认值: gzip off

  作用域: http, server, location, if (x) location

  开启或者关闭gzip模块

gzip_buffers

  语法: gzip_buffers number size

  默认值: gzip_buffers 4 4k/8k

  作用域: http, server, location

  设置系统获取几个单位的缓存用于存储gzip的压缩结果数据流。例如 4 4k 代表以4k为单位,按照原始数据大小以4k为单位的4倍申请内存。 4 8k 代表以8k为单位,按照原始数据大小以8k为单位的4倍申请内存。 

  如果没有设置,默认值是申请跟原始数据相同大小的内存空间去存储gzip压缩结果。

gzip_comp_level

  语法: gzip_comp_level 1..9

  默认值: gzip_comp_level 1

  作用域: http, server, location

  gzip压缩比,1 压缩比最小处理速度最快,9 压缩比最大但处理最慢(传输快但比较消耗cpu)。

gzip_min_length

  语法: gzip_min_length length

  默认值: gzip_min_length 0

  作用域: http, server, location

  设置允许压缩的页面最小字节数,页面字节数从header头中的Content-Length中进行获取。 

  默认值是0,不管页面多大都压缩。 

  建议设置成大于1k的字节数,小于1k可能会越压越大。即: gzip_min_length 1024

gzip_http_version

  语法: gzip_http_version 1.0|1.1

  默认值: gzip_http_version 1.1

  作用域: http, server, location

  识别http的协议版本。由于早期的一些浏览器或者http客户端,可能不支持gzip自解 压,用户就会看到乱码,所以做一些判断还是有必要的。注:21世纪都来了,现在除了类似于百度的蜘蛛之类的东西不支持自解压,99.99%的浏览器基本上 都支持gzip解压了,所以可以不用设这个值,保持系统默认即可。

gzip_proxied

  语法: gzip_proxied [off|expired|no-cache|no-store|private|no_last_modified|no_etag|auth|any] ...

  默认值: gzip_proxied off

  作用域: http, server, location

  Nginx作为反向代理的时候启用,开启或者关闭后端服务器返回的结果,匹配的前提是后端服务器必须要返回包含"Via"的 header头。 

  off - 关闭所有的代理结果数据的压缩 expired - 启用压缩,如果header头中包含 "Expires" 头信息 no-cache - 启用压缩,如果header头中包含 "Cache-Control:no-cache" 头信息 no-store - 启用压缩,如果header头中包含 "Cache-Control:no-store" 头信息 private - 启用压缩,如果header头中包含 "Cache-Control:private" 头信息 no_last_modified - 启用压缩,如果header头中不包含 "Last-Modified" 头信息 no_etag - 启用压缩 ,如果header头中不包含 "ETag" 头信息 auth - 启用压缩 , 如果header头中包含 "Authorization" 头信息 any - 无条件启用压缩

gzip_types

  语法: gzip_types mime-type [mime-type ...] 

  默认值: gzip_types text/html

  作用域: http, server, location

  匹配MIME类型进行压缩,(无论是否指定)"text/html"类型总是会被压缩的。 

  注意:如果作为http server来使用,主配置文件中要包含文件类型配置文件 

  http{ include conf/mime.types; ......} 

  如果你希望压缩常规的文件类型,可以写成这个样子 

  http { 

  include conf/mime.types; 

  gzip on;: gzip_min_length 1000; 

  gzip_buffers 4 8k; : gzip_http_version 1.1; 

  gzip_types text/plain application/x-javascript text/css text/html application/xml; 

  ...... 

  }

扩展阅读:

·   1 

网页GZip压缩在线检测:http://www.usemm.com/tool/gzip/index.php

·   2 

GZIP优化:http://www.fovweb.com/optimizer/iis-or-apache-web-enabled-optimize-gzip-compression/

·   3 

http://www.math.ecnu.edu.cn/~jypan/linux/command/gzip.htm

(责任编辑:IT)
------分隔线----------------------------
栏目列表
推荐内容