欢迎光临IT网Linux学习频道

当前位置: > Linux集群 >
  • [Hadoop] Hadoop常见异常分析及解决方法 日期:2015-05-11 03:17:00 点击:191 好评:0

    1. org.apache.hadoop.security.AccessControlException: Permission denied: user=FDC2, access=EXECUTE, inode=job_201010161322_0003:heipark:supergroup:rwx------ 解决方法:在hdfs-site.xml中添加如下: property namedfs.permissions/name valuefalse/v...

  • [Hadoop] Hadoop作业提交多种方案具体流程详解 日期:2015-05-11 03:14:58 点击:184 好评:0

    前言: 提交Hadoop作业时我们遇到了许多的问题,在网上也查过许多的文章,有许多对hadoop提交作业原理进行分析的文章,却总看不到对具体操作过程讲解的文章,导致我们在eclipse提交的作业总是在eclipse虚拟的云环境中运行。慢慢摸索中,一个一个的作业提交方...

  • [Hadoop] hadoop基本命令 日期:2015-05-11 03:12:37 点击:69 好评:0

    1.start-all.sh开启线程 hadoop fs -ls hdfs://cloud4:9000/user (cloud4表示主机名9000代表端口号/就代表根目录 /user就是user文件夹) hadoop fs -ls /user(hdfs://cloud4:9000可省略) 2. -ls/-lsr查看目录下的文件信息 hadoop fs -ls / 查看根目录下文件...

  • [Hadoop] 本地的文件上传到hadoop注意编码 日期:2015-05-11 03:12:14 点击:188 好评:0

    使用hadoop的时候要注意,本地的文件上传到hadoop之前, 看一下本地文件的编码(要使用GBK)编码, 否则在做reduce处理时,文本的第一行处理可能会有问题...

  • [Hadoop] JobConf详解Job 日期:2015-05-11 03:11:49 点击:93 好评:2

    ...

  • [Hadoop] hadoop配置多个输入路径,某个路径配置为空时 日期:2015-05-11 03:11:23 点击:171 好评:0

    hadoop配置多个输入路径,某个路径配置为空时,运算时会把路径默认为用户目录下 即: user/用户名/null...

  • [Hadoop] ERROR security.UserGroupInformation: Priviledge... 日期:2015-05-11 03:10:56 点击:180 好评:0

    Failed to set permissions of path问题 参考文献:https://issues.apache.org/jira/browse/HADOOP-8089 错误信息如下: ERROR security.UserGroupInformation: PriviledgedActionException as:hadoop cause:java.io.IOException Failed to set permissions...

  • [Hadoop] hadoop,hbase,hive安装全记录(转) 日期:2015-05-11 03:04:09 点击:150 好评:0

    操作系统:CentOS 5.5 Hadoop:hadoop-0.20.203.0 jdk1.7.0_01 namenode主机名:master,namenode的IP:10.10.102.15 datanode主机名:slave1,datanode的IP:10.10.106.8 datanode主机名:slave2,datanode的IP:10.10.106.9 一、hadoop 安装 1、建立用户 useradd...

  • [Hadoop] Windows平台Hadoop编译、安装、配置与运行(转) 日期:2015-05-11 03:00:20 点击:79 好评:0

    http://www.srccodes.com/p/article/38/build-install-configure-run-apache-hadoop-2.2.0-microsoft-windows-os...

  • [Hadoop] Mapreduce实例-分组排重(group by distinct) 日期:2015-05-11 02:59:29 点击:133 好评:0

    1 public class GroupComparator implements RawComparatorMyBinaryKey { 2 3 @Override 4 public int compare(MyBinaryKey o1, MyBinaryKey o2) { 5 return o1.toString().compareTo(o2.toString()); 6 } 7 8 @Override 9 public int compare( byte [] b1,...

  • [Hadoop] Mapreduce实例-Top Key 日期:2015-05-11 02:58:52 点击:150 好评:0

    1 public class TopK extends Configured implements Tool { 2 3 public static class TopKMapper extends MapperObject, Text, NullWritable, LongWritable { 4 5 public static final int K = 100 ; 6 private TreeMapLong, Long tm = new TreeMapLong, Lo...

  • [Hadoop] hadoop MultipleInputs fails with ClassCastException (get fileName) 日期:2015-05-11 02:58:39 点击:156 好评:0

    Following up on my comment, the Javadocs for TaggedInputSplit confirms that you are probably wrongly casting the input split to a FileSplit: /** * An {@link InputSplit} that tags another InputSplit with extra data for use * by {@link Deleg...

  • [Hadoop] hadoop safemode error 日期:2015-05-11 02:57:41 点击:197 好评:0

    1、safemode bin / hadoopfs - put ./ inputinput put : org . apache . hadoop . hdfs . server . namenode . SafeModeException : Cannotcreatedirectory / user / root / input . Namenodeisinsafemode . 解决方法: NameNode在启动的时候首先进入安全模...

  • [Hadoop] flume hdfs一些简单配置记忆 日期:2015-05-11 02:56:58 点击:177 好评:0

    1 ############################################ 2 # producer config 3 ############################################ 4 #agent section 5 producer.sources = s 6 producer.channels = c c1 c2 7 producer.sinks = r h es 8 9 #source section 10 produc...

  • [Hadoop] Speculative Execution in Hadoop 日期:2015-05-11 02:56:27 点击:60 好评:0

    所谓的推测执行,就是当所有task都开始运行之后,Job Tracker会统计所有任务的平均进度,如果某个task所在的task node机器配置比较低或者CPU load很高(原因很多),导致任务执行比总体任务的平均执行要慢,此时Job Tracker会启动一个新的任务(duplicate ta...

  • [Hadoop] Hadoop: Add third-party libraries to MapReduce job 日期:2015-05-11 02:55:45 点击:174 好评:0

    Anybody working with Hadoop should have already faced a same common issue: How to add third-party libraries to your MapReduce job. Add libjars option The first solution, maybe the most common one, consists on adding libraries using -libjar...

  • [Hadoop] 在hadoop上运行java文件 日期:2015-05-11 02:55:06 点击:128 好评:0

    hadoop 2.x版本 编译: javac -d . -classpath /usr/lib/hadoop/hadoop-common-2.2.0.2.0.6.0-102.jar TestGetPathMark.java (classpath多个jar包用分号分隔 /opt/1.jar:/opt/2.jar) 在com的同级目录上建立manifest.mf 在里面写上Main-Class: com.test.path.m...

  • [Hadoop] MapReduce三种路径输入 日期:2015-05-11 02:54:38 点击:72 好评:0

    目前为止知道MapReduce有三种路径输入方式。 1、第一种是通过一下方式输入: FileInputFormat.addInputPath(job, new Path(args[0])); FileInputFormat.addInputPath(job, new Path(args[1])); FileInputFormat.addInputPath(job, new Path(args[2])); FileIn...

  • [Hadoop] 使用hadoop eclipse plugin提交Job并添加多个第三方jar 日期:2015-05-11 02:54:01 点击:106 好评:0

    通过 conf.set(tmpjars, jars); 可以设置第三方jar,之前一直只是添加一个jar,运行OK,今天打算添加多个jar的时候发现mapreduce在运行时找不到 class(ClassNotFoundException),跟踪代码发现jar文件的确上传到了HDFS中,所以甚是无解,后来上传jar到 hdfs...

  • [Hadoop] hadoop lzo应用 日期:2015-05-11 02:53:30 点击:181 好评:0

    几种压缩方式对比: LZO example: https://github.com/twitter/hadoop-lzo/blob/master/src/test/java/com/hadoop/mapreduce/TestLzoTextInputFormat.java 给lzo文件加索引的目的是为了让lzo支持 splitable,这样hadoop可以并行处理,所以这一步很关键,生成...

  • [Hadoop] hadoop三个配置文件的参数含义说明(转) 日期:2015-05-11 02:50:49 点击:155 好评:0

    1获取默认配置 配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,...

  • [Hadoop] flume 集群datanode节点失败导致hdfs写失败(转) 日期:2015-05-11 02:50:08 点击:181 好评:0

    来自:http://www.geedoo.info/dfs-client-block-write-replace-datanode-on-failure-enable.html 这几天由于杭州集群处于升级过度时期,任务量大,集群节点少(4个DN),集群不断出现问题,导致flume收集数据出现错误,以致数据丢失。 出现数据丢失,最先拿...

  • [Hadoop] hadoop old API CombineFileInputFormat 日期:2015-05-11 02:49:32 点击:168 好评:0

    来自:http://f.dataguru.cn/thread-271645-1-1.html 简介 本文主要介绍下面4个方面 1.为什么要使用CombineFileInputFormat 2.CombineFileInputFormat实现原理 3.怎样使用CombineFileInputFormat 4.现存的问题 使用CombineFileInputFormat的目的 在开发M...

  • [Hadoop] hadoop multipleoutputs 日期:2015-05-11 02:49:08 点击:68 好评:0

    http://grepalex.com/2013/05/20/multipleoutputs-part1/ http://grepalex.com/2013/07/16/multipleoutputs-part2/...

  • [Hadoop] hadoop 文件合并 日期:2015-05-11 02:48:05 点击:121 好评:2

    众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。 1,getmerge hadoop有一个命令行工具getmerge,用于将一组HDFS上的文件复制到本地计算机以前进行合并 参考:http://hadoop.apa...

  • [Hadoop] hadoop-处理小文件 日期:2015-05-11 02:47:41 点击:71 好评:0

    一个Hadoop程序的优化过程 根据文件实际大小实现CombineFileInputFormat http://www.rigongyizu.com/hadoop-job-optimize-combinefileinputformat/ mapreduce job让一个文件只由一个map来处理 http://www.rigongyizu.com/mapreduce-job-one-map-process-one-...

  • [Hadoop] MapReduce实现大矩阵乘法 日期:2015-05-11 02:47:04 点击:78 好评:0

    引言 何 为大矩阵?Excel、SPSS,甚至SAS处理不了或者处理起来非常困难,需要设计巧妙的分布式方法才能高效解决基本运算(如转置、加法、乘法、求逆) 的矩阵,我们认为其可被称为大矩阵。这意味着此种矩阵的维度至少是百万级的、经常是千万级的、有时是亿万...

  • [Hadoop] Mahout 协同过滤 itemBase RecommenderJob源码分析 日期:2015-05-11 02:46:29 点击:114 好评:0

    Mahout支持2种 M/R 的jobs实现itemBase的协同过滤 I.ItemSimilarityJob II.RecommenderJob 下面我们对RecommenderJob进行分析,版本是mahout-distribution-0.7 源码包位置:org.apache.mahout.cf.taste.hadoop.item.RecommenderJob RecommenderJob前几个阶段...

栏目列表
推荐内容