• hadoop压缩与解压

    日期:

    目录[-] 1 压缩 2 Hadoop压缩简介 3 Hadoop压缩API应用实例 1 压缩 一般来说,计算机处理的数据都存在一些冗余度,同时数据中间,尤其是相邻数据间存在着相关性,所以可以通过一些有别于原始编码的特殊编码方式来保存数据, 使数据占用的存储空间比较小,这...

  • hadoop中4种压缩格式的特征的比较

    日期:

    1 gzip压缩 优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带gzip命令,使用方便。 缺点:不支持split。 应用场景:当每个文件压缩之后在130M以...

  • hadoop源码解析2 - conf包中Configuration.java解析

    日期:

    1 Hadoop Configuration简介 Hadoop没有使用java.util.Properties管理配置文件,也没有使用Apache Jakarta Commons Configuration管理配置文件,而是使用了一套独有的配置文件管理系统,并提供自己的API,即使用org.apache.hadoop.conf.Configuration处理配...

  • hadoop源码解析1 - hadoop中各工程包依赖关系

    日期:

    1hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。 GoogleCluster: http://research.google.com/archive/googlecluster.html Chubby:http://labs.google.com/papers/chubby.html GFS...

  • 如何恢复hadoop中被删除的文件

    日期:

    如何恢复hadoop中被删除的文件...

  • Hadoop 2.2.0 在单个Redhat Enterprise Linux 6.4 64bit 虚拟机

    日期:

    Hadoop 2.2.0 安装路径: /opt/hadoop-2.2.0 Java版本: [steve@bmc opt]$ java -version java version 1.7.0_45 Java(TM) SE Runtime Environment (build 1.7.0_45-b18) Java HotSpot(TM) 64-Bit Server VM (build 24.45-b08, mixed mode) 用于运行Hadoop的用...

  • Hadoop集群(第10期副刊)_常用MySQL数据库命令

    日期:

    1、系统管理 1.1 连接MySQL 格式: mysql -h主机地址 -u用户名 -p用户密码 举例: 例1:连接到本机上的MySQL。 首先在打开DOS窗口,然后进入目录 mysqlbin,再键入命令mysql u root p,回车后提示你输密码,如果刚安装好MySQL,超级用户root是没有密码的,...

  • Hadoop集群(第10期)_MySQL关系数据库

    日期:

    1、MySQL安装 MySQL下载地址: http://www.mysql.com/downloads/ 1.1 Windows平台 1)准备软件 MySQL版本:mysql-5.5.21-win32.msi 2)安装环境: 操作系统:Windows 7旗舰版 3)开始安装 第一步:双击msi安装文件,出现如图1.1-1界面MySQL安装向导,按Next...

  • Hadoop集群(第9期)_MapReduce初级案例

    日期:

    1、数据去重 数据去重主要是为了掌握和利用并行化思想来对数据进行有意义的筛...

  • Hadoop集群(第8期)_HDFS初探之旅

    日期:

    1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性...