• 走近伏羲,谈5000节点集群调度与 性能优化

    日期:

    5K项目是飞天平台的里程碑,系统在规模、性能和容错方面都得到了飞跃式的发展,达到世界领先水平。伏羲作为飞天平台的分布式调度系统,能支持单集群5000节点,并发运行10000作业,30分钟完成100TB数据Terasort,性能是当时Yahoo!在SortBenchmark上世界纪录的...

  • hadoop dfs 操作

    日期:

    791 cd /home/hadoop/hadoop/hadoop-1.0.2/ 792 bin/hadoop jar hadoop-examples-1.0.2.jar wordcount input out11 793 bin/hadoop jar hadoop-examples-1.0.2.jar wordcount input/* out1111/ 794 bin/hadoop jar hadoop-examples-1.0.2.jar wordcount inpu...

  • Hadoop作业提交与执行源码分析

    日期:

    Hadoop 作业提交与执行源码分析 1 概述 Job 执行整体流程图 2 Job 创建与提交过程 2.1 Configuration 类 Configuration 类定义了如下私有成员变量: /* 第一个是 boolean 型变量 quietmode ,用于设置加载配置的模式。通过阅读源代码就可以清楚,这个 quietm...

  • hadoop任务测试

    日期:

    cd echoHelloWorldByeWorldfile01 echoHelloHadoopGoodbyeHadoopfile02 (2) 在 hdfs 中建立一个 input 目录 : cdhadoop/hadoop1.0.0/bin/ ./ hadoopdfsmkdirinput (3) 将 file01 和 file02 拷贝到 hdfs 中: ./ hadoopdfsput ~ /file0*input (4) 执行 wordc...

  • hadoop操作命令

    日期:

    sudo chown hadoop:hadoop * 将该文件权限改为hadoop用户权限 sudo chown -R hadoop:hadoop * 将该文件权限改为hadoop用户权限 scp 一般文件 datanode1:/home/hadoop/hadoop 使用ssh将namenode节点文件传到datanode1节点机器上相应文件夹中 scp -r 文件夹 da...

  • hadoop错误代码查询

    日期:

    经常遇到的exception是:PipeMapRed.waitOutputThreads(): subprocess failed with code N OS error code 1: Operation not permitted OS error code 2: No such file or directory OS error code 3: No such process OS error code 4: Interrupted system c...

  • Warning: $HADOOP_HOME is deprecated. hadoop1.0....

    日期:

    添加 export HADOOP_HOME_WARN_SUPPRESS=TRUE到 hadoop-env.sh 中 注意要添加到集群中每一个节点中。 版本:hadoop 0.20.205 原因: Hadoop 在bin/hadoop-config.sh 中对HADOOP_HOME 进行了判断 判断发生的地方: # the root of the Hadoop installation exp...

  • 从安装linux到安装hadoop

    日期:

    1. windows install vmware 2. change the CD-ROM as ISO files 3. install ubuntu os 4. change root password using passwd root command sudo passwd root install ssh : sudo apt-get install ssh 5. enter the command of startX 6. sudo apt-get insta...

  • hadoop关注点

    日期:

    http://hadoop.apache.org/common/docs/r0.18.3/hdfs_design.html Browser Interface A typical HDFS install configures a web server to expose the HDFS namespace through a configurable TCP port. This allows a user to navigate the HDFS namespace...

  • job监控与hadoop权限管理

    日期:

    3监测Hadoop控制中心及作业运行状况 MapReduce框架由一个单独的Master JobTracker和集群节点上的Slave TaskTracker共同组成,在Hadoop的JobClient提交作业和配置信息给JobTracker之后,JobTracker会负责分发这些软件和配置信息给slave及调度任务,并监控它们...