欢迎光临IT网Linux学习频道

当前位置: > Linux集群 > Hadoop >
  • [Hadoop] hadoop-streaming 例子 日期:2015-10-08 12:05:12 点击:195 好评:0

    Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如: 采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer) 1 2 bin/hadoop jar contrib/streaming/hadoop-0....

  • [Hadoop] [Hadoop] Sqoop安装过程详解 日期:2015-10-08 12:04:05 点击:129 好评:0

    Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。 Sqoop官方版本:http://apache.dataguru.cn/sqoop/1...

  • [Hadoop] ubuntu 安装hadoop 伪分布模式 日期:2015-10-08 12:03:51 点击:117 好评:0

    1/首先在官网下载hadoop文件,hadoop-0.23.6.tar.gz 2/系统下要安装jdk 我的系统jdk安装在:JAVA_HOME=/usr/lib/jvm/java-6-oracle 3/解压hadoop-0.23.6.tar.gz文件: 1 tar -xvzf hadoop-0.23.6.tar.gz 给文件设置所有者 1 #chown -R tianbx:tianbx title.tx...

  • [Hadoop] hadoop-mapreduce分析 日期:2015-10-08 12:02:42 点击:164 好评:0

    把整个Hadoop看作是容器,那么Mapper和Reduce就是容器里的组件,*Context保存了组件的一些配置信息,同时也是和容器通信的机制。 参数 作用 缺省值 其它实现 InputFormat 将输入的数据集切割成小数据集InputSplits,每一个InputSplit将由一个Mapper负责处理。...

  • [Hadoop] hadoop-Mapper分析 日期:2015-10-08 12:01:33 点击:78 好评:0

    2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 8...

  • [Hadoop] hadoop-reduce分析 日期:2015-10-08 12:01:00 点击:154 好评:0

    Map的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出 Map的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出。 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18...

  • [Hadoop] hadoop-ID分析 日期:2015-10-08 12:00:18 点击:60 好评:0

    我们开始来分析Hadoop MapReduce的内部的运行机制。用户向Hadoop提交Job(作业),作业在JobTracker对象的控制下执行。Job被分解成为Task(任务),分发到集群中,在TaskTracker的控制下运行。Task包括MapTask和ReduceTask,是MapReduce的Map操作和Reduce操...

  • [Hadoop] Hadoop杂记 日期:2015-10-08 11:56:59 点击:148 好评:0

    namenode(hdfs)+jobtracker(mapreduce)可以放在一台机器上,datanode+tasktracker可以在一台机器上,辅助namenode要单独放一台机器,jobtracker通常情况下分区跟datanode一样(目录最好分布在不同的磁盘上,一个目录对应一个磁盘),namenode存储目录需要...

  • [Hadoop] hadoop 节点正常启动可是50075/50030不能访问 日期:2015-10-08 11:56:25 点击:123 好评:0

    情景描述: 因为以前namenode节点下面的hadoop/lib文件夹加入了一些别的jar包(为了测试一些东西),而datanode节点下面的hadoop/lib文件夹没有增加.导致hadoop启动错误.为了统一,我把namenode节点下面的hadoop/lib文件夹下面的所有文件都删除了,从datanode节点...

  • [Hadoop] Cannot delete .... . Name node is in safe mode 日期:2015-10-08 11:55:52 点击:144 好评:0

    摘要org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete /benchmarks/TestDFSIO/io_control. Name node is in safe mode. 如何关闭安全模式呢? 命令为: 1 bin/hadoop dfsadmin -safemode le...

栏目列表
推荐内容