欢迎光临IT网Linux学习频道

当前位置: > Linux集群 >
  • [Hadoop] 启动hadoop2.3.0时显示JAVA_HOME is not set and could not 日期:2014-11-04 18:12:43 点击:215 好评:0

    启动hadoop2.3.0时显示JAVA_HOME is not set and could not 使用start-all.sh直接启动Hadoop 如果报如下错误:localhost:Error: JAVA_HOME is not set and could not be found.则是因为JAVA_HOME环境变量没有设置,需要在./etc/hadoop/hadoop-env.sh中设置JAV...

  • [Hadoop] Please set $HADOOP_COMMON_HOME to the root 日期:2014-11-04 18:11:56 点击:71 好评:0

    [root@centos2 sqoop-1.4.4.bin__hadoop-1.0.0]# bin/sqoop help Error: /usr/lib/hadoop does not exist! Please set $HADOOP_COMMON_HOME to the root of your Hadoop installation. 需要配置sqoop-env.sh文件 在sqoop中conf目录下新复制一个sqoop-env.sh...

  • [Hadoop] hive.metastore.HiveMetaStoreClient​ 日期:2014-11-04 18:01:15 点击:158 好评:0

    14/04/07 15:33:21 INFO hive.metastore: Waiting 1 seconds before next connection attempt. 14/04/07 15:33:22 INFO hive.metastore: Trying to connect to metastore with URI thrift://127.0.0.1:9083 14/04/07 15:33:22 WARN hive.metastore: Failed t...

  • [Hadoop] Permission denied: user=root, access=WRITE 日期:2014-11-04 18:00:52 点击:80 好评:2

    hive create database bbs; FAILED: Error in metadata: MetaException(message:Got exception: org.apache.hadoop.security.AccessControlException Permission denied: user=root, access=WRITE, inode=/user/hive/warehouse:hadoop:hadoop:drwxrwxr-x 原...

  • [Hadoop] 各hbase版本对hadoop各版本的支持情况 日期:2014-11-04 17:59:20 点击:81 好评:0

    原文地址:http://hbase.apache.org/book/configuration.html#basic.prerequisites Table2.1.Hadoop version support matrix Hadoop-0.20.205 S X X X Hadoop-0.22.x S X X X Hadoop-1.0.0-1.0.2 [a] S S X X Hadoop-1.0.3+ S S S X Hadoop-1.1.x NT S S X H...

  • [Hadoop] mapreduce中wordcount详细介绍(包括hadoop1和hadoop2版本) 日期:2014-11-04 17:57:55 点击:167 好评:0

    mapreduce中wordcount详细介绍(包括hadoop1和hadoop2版本) 目录[-] 1.1 MapReduce编程模型 1.2 MapReduce处理过程 2、运行WordCount程序 2.1 准备工作 2.2 运行例子 2.3 查看结果 3、WordCount源码分析 3.1 特别数据类型介绍 3.2 旧的WordCount分析 3.3 新...

  • [Hadoop] Hadoop 1.0.3 在CentOS 6.2上安装过程 日期:2014-11-04 17:56:10 点击:57 好评:0

    //安装SSH [root@localhost /]# sudo yum install ssh //生成密钥 [root@localhost /]# ssh-keygen (可以一路回车) 生成下面两个文件: /root/.ssh/id_rsa /root/.ssh/id_rsa.pub [root@localhost .ssh]# cd /root/.ssh/ //实际情况是把公钥复制到另外一台...

  • [Hadoop] Hadoop的shell脚本分析 日期:2014-11-04 17:20:42 点击:146 好评:0

    Hadoop的shell脚本分析 前记: 这些天一直学习hadoop,学习中也遇到了许多的问题,主要是对hadoop的shell脚本和hadoop的源码概念不够清楚,所以我就对hadoop的bin目录下的shell脚本进行了研究,有一些成果想记录下来,也希望大家前来批评指正。 分析原因: 很...

  • [Hadoop] hadoop启动脚本分析 日期:2014-11-04 17:20:03 点击:67 好评:0

    HadoopCluster的启动可以说十分简单,最简单的一种方法就是运行$HADOOP_HOME/bin/start-all.sh,我也相信绝大多数的人都是这么启动的。但是这个脚本里面到底做了些什么呢?让我们来抽丝剥茧的看一看: 注:不失一般性,我们这里以dfs的启动为例子,mapred的启...

  • [Hadoop] non dfs used 和dfs remaining区别 日期:2014-11-04 17:15:49 点击:235 好评:0

    DFS Used hadoop文件系统所使用的空间 Non DFS Used 非hadoop文件系统所使用的空间,比如说本身的linux系统使用的,或者存放的其它文件...

  • [Hadoop] Hadoop YARN中内存和CPU两种资源的调度和隔离 日期:2014-11-04 16:58:14 点击:95 好评:0

    同时支持内存和CPU两种资源的调度(默认只支持内存,如果想进一步调度CPU,需要自己进行一些配置),本文将介绍Hadoop YARN是如何对这些资源进行调度和隔离的。 在YARN中,资源管理由ResourceManager和NodeManager共同完成,其中,ResourceManager中的调度器...

  • [Hadoop] MapReduce: 提高MapReduce性能的七点建议 日期:2014-11-04 16:57:40 点击:171 好评:0

    Cloudera提供给客户的服务内容之一就是调整和优化MapReduce job执行性能。MapReduce和HDFS组成一个复杂的分布式系统,并且它们运行着各式各样用户的代码,这样导致没有一个快速有效的规则来实现优化 代码性能的目的。在我看来,调整cluster或job的运行更像一...

  • [Hadoop] hadoop作业调优参数整理及原理(主要为shuffle过程) 日期:2014-11-04 16:50:27 点击:129 好评:0

    目录[-] 1 Map side tuning参数 1.1 MapTask运行内部原理 1.2 Map side相关参数调优 2 Reduce side tuning参数 2.1 ReduceTask运行内部原理 2.2 Reduce side相关参数调优 1 Map side tuning参数 1.1 MapTask运行内部原理 当map task开始运算,并产生中间数据...

  • [Hadoop] hadoop数据库操作解析及注意事项 日期:2014-11-04 16:50:02 点击:178 好评:0

    1从mysql读数据到hdfs: mapreduce读数据库数据到hdfs使用map读取,连接数和map数对应,读的时候会锁表读取全量数据,此时,其它更新或者写入操作就会处于等待状态。所以读的数据库尽量不能为主库,而是用从库,主库主要负责写,从库主要负责读。若锁表读取...

  • [Hadoop] hadoop权限管理 日期:2014-11-04 16:46:30 点击:167 好评:0

    如下图,hadoop访问控制分为两级,其中ServiceLevel Authorization为系统级,用于控制是否可以访问指定的服务,例如用户/组是否可以向集群提交Job,它是最基础的访问控制,优先于文件权限和 mapred队列权限验证。Access Control on Job Queues在job调度策略...

  • [Hadoop] hadoop和Google分布式系统对应产品 日期:2014-11-04 16:45:51 点击:172 好评:0

    ...

  • [Hadoop] hadoop返回json格式所有监控值 日期:2014-11-04 16:45:21 点击:148 好评:0

    datanode监控json格式数据:将http://namenode_ip:50070/dfshealth.jsp的地址替换成http://namenode_ip:50070/jmx resourcemanager监控json格式数据:将http://resourcemanager_ip:8088/dfshealth.jsp的地址替换成http://resourcemanager_ip:8088/jmx 参考文...

  • [Hadoop] hadoop压缩与解压 日期:2014-11-04 16:44:29 点击:97 好评:0

    目录[-] 1 压缩 2 Hadoop压缩简介 3 Hadoop压缩API应用实例 1 压缩 一般来说,计算机处理的数据都存在一些冗余度,同时数据中间,尤其是相邻数据间存在着相关性,所以可以通过一些有别于原始编码的特殊编码方式来保存数据, 使数据占用的存储空间比较小,这...

  • [Hadoop] hadoop中4种压缩格式的特征的比较 日期:2014-11-04 16:43:58 点击:165 好评:0

    1 gzip压缩 优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带gzip命令,使用方便。 缺点:不支持split。 应用场景:当每个文件压缩之后在130M以...

  • [Hadoop] hadoop源码解析2 - conf包中Configuration.java解析 日期:2014-11-04 16:43:10 点击:213 好评:0

    1 Hadoop Configuration简介 Hadoop没有使用java.util.Properties管理配置文件,也没有使用Apache Jakarta Commons Configuration管理配置文件,而是使用了一套独有的配置文件管理系统,并提供自己的API,即使用org.apache.hadoop.conf.Configuration处理配...

  • [Hadoop] hadoop源码解析1 - hadoop中各工程包依赖关系 日期:2014-11-04 16:42:43 点击:62 好评:0

    1hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。 GoogleCluster: http://research.google.com/archive/googlecluster.html Chubby:http://labs.google.com/papers/chubby.html GFS...

  • [Hadoop] 如何恢复hadoop中被删除的文件 日期:2014-11-04 16:42:19 点击:157 好评:0

    如何恢复hadoop中被删除的文件...

  • [Hadoop] Hadoop 2.2.0 在单个Redhat Enterprise Linux 6.4 64bit 虚拟机 日期:2014-11-03 08:52:32 点击:150 好评:0

    Hadoop 2.2.0 安装路径: /opt/hadoop-2.2.0 Java版本: [steve@bmc opt]$ java -version java version 1.7.0_45 Java(TM) SE Runtime Environment (build 1.7.0_45-b18) Java HotSpot(TM) 64-Bit Server VM (build 24.45-b08, mixed mode) 用于运行Hadoop的用...

  • [Hadoop] Hadoop集群(第10期副刊)_常用MySQL数据库命令 日期:2014-11-02 11:49:32 点击:153 好评:0

    1、系统管理 1.1 连接MySQL 格式: mysql -h主机地址 -u用户名 -p用户密码 举例: 例1:连接到本机上的MySQL。 首先在打开DOS窗口,然后进入目录 mysqlbin,再键入命令mysql u root p,回车后提示你输密码,如果刚安装好MySQL,超级用户root是没有密码的,...

  • [Hadoop] Hadoop集群(第10期)_MySQL关系数据库 日期:2014-11-02 11:48:49 点击:179 好评:0

    1、MySQL安装 MySQL下载地址: http://www.mysql.com/downloads/ 1.1 Windows平台 1)准备软件 MySQL版本:mysql-5.5.21-win32.msi 2)安装环境: 操作系统:Windows 7旗舰版 3)开始安装 第一步:双击msi安装文件,出现如图1.1-1界面MySQL安装向导,按Next...

  • [Hadoop] Hadoop集群(第9期)_MapReduce初级案例 日期:2014-11-02 11:48:09 点击:180 好评:0

    1、数据去重 数据去重主要是为了掌握和利用并行化思想来对数据进行有意义的筛...

  • [Hadoop] Hadoop集群(第8期)_HDFS初探之旅 日期:2014-11-02 11:47:34 点击:116 好评:0

    1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性...

  • [Hadoop] Hadoop集群(第7期)_Eclipse开发环境设置 日期:2014-11-02 11:46:58 点击:206 好评:0

    1、Hadoop开发环境简介 1.1 Hadoop集群简介 Java版本:jdk-6u31-linux-i586.bin Linux系统:CentOS6.0 Hadoop版本:hadoop-1.0.0.tar.gz 1.2 Windows开发简介 Java版本:jdk-6u31-windows-i586.exe Win系统:Windows 7 旗舰版 Eclipse软件:eclipse-jee-indi...

栏目列表
推荐内容