欢迎光临IT网Linux学习频道

当前位置: > Linux集群 > Hadoop >
  • [Hadoop] 使用Storm实现实时大数据分析 日期:2015-08-03 00:40:54 点击:146 好评:0

    摘要: 随着数据体积的越来越大,实时处理成为了许多机构需要面对的首要挑战。Shruthi Kumar和Siddharth Patankar在Dr.Dobbs上结合了汽车超速监视,为我们演示了使用Storm进行实时大数据分析。CSDN在此编译、整理。 简单和明了,Storm让大数据分析变得轻松加...

  • [Hadoop] CentOS6.4下搭建hadoop2.2(64bit)注意事项 日期:2015-07-12 02:00:05 点击:113 好评:0

    注:本文针对64位机器,32bit课直接tar -zxvfhadoop-2.2.0.tar.gz解压配置即可。 Step1:安装jdk(6以上版本) Step2:下载hadoop---http://mirror.esocc.com/apache/hadoop/common/hadoop-2.2.0/选择hadoop-2.2.0-src.tar.gz 进行源码编译安装。 为什么选择...

  • [Hadoop] Hadoop常见重要命令行操作及命令作用 日期:2015-06-27 22:28:05 点击:177 好评:0

    关于Hadoop [root@master ~]# hadoop --help Usage: hadoop [--config confdir] COMMAND where COMMAND is one of: fs run a generic filesystem user client version print the version jar jar run a jar file checknative [-a|-h] check native hadoop and...

  • [Hadoop] Hadoop Yarn 日期:2015-06-24 22:25:35 点击:95 好评:0

    http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/ http://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-site/YARN.html http://zh.hortonworks.com/hadoop/yarn/ http://www.csdn.net/article/2013-12-18/2817842-bd-hadoopya...

  • [Hadoop] MapReduce提交作业常见问题 日期:2015-05-11 03:17:29 点击:62 好评:0

    1.从HDFS上传下载文件到 第一种错误: spanstyle= font-size:medium; Exceptioninthread main java.lang.IllegalArgumentException: WrongFS:hdfs: //192.168.1.11:9000/usr/yujing/wordcount, expected:hdfs: //master:9000/span 这个很多人都遇到过,不管...

  • [Hadoop] Hadoop常见异常分析及解决方法 日期:2015-05-11 03:17:00 点击:191 好评:0

    1. org.apache.hadoop.security.AccessControlException: Permission denied: user=FDC2, access=EXECUTE, inode=job_201010161322_0003:heipark:supergroup:rwx------ 解决方法:在hdfs-site.xml中添加如下: property namedfs.permissions/name valuefalse/v...

  • [Hadoop] Hadoop作业提交多种方案具体流程详解 日期:2015-05-11 03:14:58 点击:184 好评:0

    前言: 提交Hadoop作业时我们遇到了许多的问题,在网上也查过许多的文章,有许多对hadoop提交作业原理进行分析的文章,却总看不到对具体操作过程讲解的文章,导致我们在eclipse提交的作业总是在eclipse虚拟的云环境中运行。慢慢摸索中,一个一个的作业提交方...

  • [Hadoop] hadoop基本命令 日期:2015-05-11 03:12:37 点击:69 好评:0

    1.start-all.sh开启线程 hadoop fs -ls hdfs://cloud4:9000/user (cloud4表示主机名9000代表端口号/就代表根目录 /user就是user文件夹) hadoop fs -ls /user(hdfs://cloud4:9000可省略) 2. -ls/-lsr查看目录下的文件信息 hadoop fs -ls / 查看根目录下文件...

  • [Hadoop] 本地的文件上传到hadoop注意编码 日期:2015-05-11 03:12:14 点击:188 好评:0

    使用hadoop的时候要注意,本地的文件上传到hadoop之前, 看一下本地文件的编码(要使用GBK)编码, 否则在做reduce处理时,文本的第一行处理可能会有问题...

  • [Hadoop] JobConf详解Job 日期:2015-05-11 03:11:49 点击:93 好评:2

    ...

  • [Hadoop] hadoop配置多个输入路径,某个路径配置为空时 日期:2015-05-11 03:11:23 点击:171 好评:0

    hadoop配置多个输入路径,某个路径配置为空时,运算时会把路径默认为用户目录下 即: user/用户名/null...

  • [Hadoop] ERROR security.UserGroupInformation: Priviledge... 日期:2015-05-11 03:10:56 点击:180 好评:0

    Failed to set permissions of path问题 参考文献:https://issues.apache.org/jira/browse/HADOOP-8089 错误信息如下: ERROR security.UserGroupInformation: PriviledgedActionException as:hadoop cause:java.io.IOException Failed to set permissions...

  • [Hadoop] hadoop,hbase,hive安装全记录(转) 日期:2015-05-11 03:04:09 点击:150 好评:0

    操作系统:CentOS 5.5 Hadoop:hadoop-0.20.203.0 jdk1.7.0_01 namenode主机名:master,namenode的IP:10.10.102.15 datanode主机名:slave1,datanode的IP:10.10.106.8 datanode主机名:slave2,datanode的IP:10.10.106.9 一、hadoop 安装 1、建立用户 useradd...

  • [Hadoop] Windows平台Hadoop编译、安装、配置与运行(转) 日期:2015-05-11 03:00:20 点击:79 好评:0

    http://www.srccodes.com/p/article/38/build-install-configure-run-apache-hadoop-2.2.0-microsoft-windows-os...

  • [Hadoop] Mapreduce实例-分组排重(group by distinct) 日期:2015-05-11 02:59:29 点击:133 好评:0

    1 public class GroupComparator implements RawComparatorMyBinaryKey { 2 3 @Override 4 public int compare(MyBinaryKey o1, MyBinaryKey o2) { 5 return o1.toString().compareTo(o2.toString()); 6 } 7 8 @Override 9 public int compare( byte [] b1,...

  • [Hadoop] Mapreduce实例-Top Key 日期:2015-05-11 02:58:52 点击:150 好评:0

    1 public class TopK extends Configured implements Tool { 2 3 public static class TopKMapper extends MapperObject, Text, NullWritable, LongWritable { 4 5 public static final int K = 100 ; 6 private TreeMapLong, Long tm = new TreeMapLong, Lo...

  • [Hadoop] hadoop MultipleInputs fails with ClassCastException (get fileName) 日期:2015-05-11 02:58:39 点击:156 好评:0

    Following up on my comment, the Javadocs for TaggedInputSplit confirms that you are probably wrongly casting the input split to a FileSplit: /** * An {@link InputSplit} that tags another InputSplit with extra data for use * by {@link Deleg...

  • [Hadoop] hadoop safemode error 日期:2015-05-11 02:57:41 点击:197 好评:0

    1、safemode bin / hadoopfs - put ./ inputinput put : org . apache . hadoop . hdfs . server . namenode . SafeModeException : Cannotcreatedirectory / user / root / input . Namenodeisinsafemode . 解决方法: NameNode在启动的时候首先进入安全模...

  • [Hadoop] flume hdfs一些简单配置记忆 日期:2015-05-11 02:56:58 点击:177 好评:0

    1 ############################################ 2 # producer config 3 ############################################ 4 #agent section 5 producer.sources = s 6 producer.channels = c c1 c2 7 producer.sinks = r h es 8 9 #source section 10 produc...

  • [Hadoop] Speculative Execution in Hadoop 日期:2015-05-11 02:56:27 点击:60 好评:0

    所谓的推测执行,就是当所有task都开始运行之后,Job Tracker会统计所有任务的平均进度,如果某个task所在的task node机器配置比较低或者CPU load很高(原因很多),导致任务执行比总体任务的平均执行要慢,此时Job Tracker会启动一个新的任务(duplicate ta...

  • [Hadoop] Hadoop: Add third-party libraries to MapReduce job 日期:2015-05-11 02:55:45 点击:174 好评:0

    Anybody working with Hadoop should have already faced a same common issue: How to add third-party libraries to your MapReduce job. Add libjars option The first solution, maybe the most common one, consists on adding libraries using -libjar...

  • [Hadoop] 在hadoop上运行java文件 日期:2015-05-11 02:55:06 点击:128 好评:0

    hadoop 2.x版本 编译: javac -d . -classpath /usr/lib/hadoop/hadoop-common-2.2.0.2.0.6.0-102.jar TestGetPathMark.java (classpath多个jar包用分号分隔 /opt/1.jar:/opt/2.jar) 在com的同级目录上建立manifest.mf 在里面写上Main-Class: com.test.path.m...

  • [Hadoop] MapReduce三种路径输入 日期:2015-05-11 02:54:38 点击:72 好评:0

    目前为止知道MapReduce有三种路径输入方式。 1、第一种是通过一下方式输入: FileInputFormat.addInputPath(job, new Path(args[0])); FileInputFormat.addInputPath(job, new Path(args[1])); FileInputFormat.addInputPath(job, new Path(args[2])); FileIn...

  • [Hadoop] 使用hadoop eclipse plugin提交Job并添加多个第三方jar 日期:2015-05-11 02:54:01 点击:106 好评:0

    通过 conf.set(tmpjars, jars); 可以设置第三方jar,之前一直只是添加一个jar,运行OK,今天打算添加多个jar的时候发现mapreduce在运行时找不到 class(ClassNotFoundException),跟踪代码发现jar文件的确上传到了HDFS中,所以甚是无解,后来上传jar到 hdfs...

  • [Hadoop] hadoop lzo应用 日期:2015-05-11 02:53:30 点击:181 好评:0

    几种压缩方式对比: LZO example: https://github.com/twitter/hadoop-lzo/blob/master/src/test/java/com/hadoop/mapreduce/TestLzoTextInputFormat.java 给lzo文件加索引的目的是为了让lzo支持 splitable,这样hadoop可以并行处理,所以这一步很关键,生成...

  • [Hadoop] hadoop三个配置文件的参数含义说明(转) 日期:2015-05-11 02:50:49 点击:155 好评:0

    1获取默认配置 配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,...

  • [Hadoop] flume 集群datanode节点失败导致hdfs写失败(转) 日期:2015-05-11 02:50:08 点击:181 好评:0

    来自:http://www.geedoo.info/dfs-client-block-write-replace-datanode-on-failure-enable.html 这几天由于杭州集群处于升级过度时期,任务量大,集群节点少(4个DN),集群不断出现问题,导致flume收集数据出现错误,以致数据丢失。 出现数据丢失,最先拿...

  • [Hadoop] hadoop old API CombineFileInputFormat 日期:2015-05-11 02:49:32 点击:168 好评:0

    来自:http://f.dataguru.cn/thread-271645-1-1.html 简介 本文主要介绍下面4个方面 1.为什么要使用CombineFileInputFormat 2.CombineFileInputFormat实现原理 3.怎样使用CombineFileInputFormat 4.现存的问题 使用CombineFileInputFormat的目的 在开发M...

栏目列表
推荐内容