欢迎光临IT网Linux学习频道

当前位置: > Linux集群 > Hadoop >
  • [Hadoop] Apache Hadoop下一代MapReduce框架(YARN)简介 (Apache Hadoop NextGen MapReduce (YARN)) 日期:2016-07-24 19:24:22 点击:84 好评:0

    英文看着头大,先试着翻译一下。 E文原文: http://archive.cloudera.com/cdh5/cdh/5/hadoop/hadoop-yarn/hadoop-yarn-site/YARN.html 翻译真是太难了,而且我翻译的好烂,好烂,有时候自己也只能理解个大概。 ====================================begin===...

  • [Hadoop] MyEclipse开发hadoop时报org.apache.hadoop.security.AccessControlException: Permission denied: 日期:2016-07-19 23:29:12 点击:135 好评:0

    用MyEclipse开发hadoop时报org.apache.hadoop.security.AccessControlException: Permission denied: 停止hadoop测试环境: [hadoop@icity0bin]$./stop-all.sh Warning:$HADOOP_HOMEisdeprecated. stoppingjobtracker icity1:stoppingtasktracker icity2:sto...

  • [Hadoop] hadoop hdfs java api操作实战 日期:2016-07-19 23:27:41 点击:83 好评:0

    hadoop java api操作实战: 公共方法: staticfinalStringPATH=hdfs://icity0:9000/; privatestaticFileSystemgetFileSystem()throwsIOException,URISyntaxException{ FileSystemfileSystem=FileSystem.get(newURI(PATH),newConfiguration()); returnfileSys...

  • [Hadoop] hadoop shell 操作指南 日期:2016-07-19 23:25:27 点击:77 好评:0

    hadoop shell 操作指南 FS Shell 调用文件系统(FS)Shell命令应使用bin/hadoop fs args的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和aut...

  • [Hadoop] hadoop1.1.2分布式环境搭建 日期:2016-07-19 23:09:11 点击:143 好评:0

    hadoop1.1.2分布式安装 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式...

  • [Hadoop] Hadoop家族学习路线图 日期:2016-07-14 16:14:17 点击:141 好评:0

    Hadoop家族系列文章 ,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。 从2011年开...

  • [Hadoop] 使用配置Hadoop中常用的Linux(Ubuntu)命令 日期:2016-06-11 21:41:07 点击:61 好评:0

    使用配置Hadoop中常用的linux(Ubuntu)命令 生成key: $ ssh-keygen -t dsa -P -f ~/.ssh/id_dsa $ cat ~/.ssh/id_dsa.pub ~/.ssh/authorized_keys -t 密钥类型可以用 -t 选项指定。如果没有指定则默认生成用于SSH-2的RSA密钥。 -f filename 指定密钥文件名。...

  • [Hadoop] Hadoop在Map阶段获取当前split的文件名 日期:2016-06-10 01:25:30 点击:141 好评:0

    在mapper处理阶段中有时候我们需要获取当前正在处理的HDFS文件名/HDFS目录名,其实我们可以通过 Context 来获取相关参数,代码类似如下: 1 2 3 4 5 FileSplit fileSplit = (FileSplit) context.getInputSplit(); System.out.println(======== getPath.getNa...

  • [Hadoop] hadoop多硬盘配置注意点 日期:2016-06-10 01:24:26 点击:86 好评:0

    [一]、实验环境 1.1、环境 hadoop 2.6.0 namenode 2个 各增加 2个1T硬盘 datanode 3个 各增加3个1T硬盘 1.2、挂载硬盘 fdisk 分区 (输入mnp1回车回车pw) mkfs 格式化硬盘 ( mkfs.ext4 ) mount 挂载硬盘 (以挂载目录为 /bigdata/data0 /bigdata/data1 . /bigd...

  • [Hadoop] Hadoop修改配置PID文件路径 日期:2016-06-10 01:20:22 点击:154 好评:0

    [一]、 概述 Hadoop启动后的PID文件默认配置是保存在 /tmp 目录下的,而linux下 /tmp 目录会定时清理,所以在集群运行一段时间后如果在停Hadoop相关服务是会出现类似:no datanode to stop 的错误提示,一般生产环境中我们需要重新修改PID的保存路径。 [二]、...

  • [Hadoop] HBase安装配置snappy压缩算法 日期:2016-06-10 01:19:20 点击:83 好评:0

    [一]、前提 首先是snappy编译安装和hadoop-snappy编译,这个可以直接参考:Hadoop安装配置snappy压缩,所有前提准备好后,HBase上安装配置snappy压缩算法就相对简单多了。 [二]、实验环境 角色 OS(系统) JDK Master CentOS6.3 1.7.0_75 RegionServer CentOS5...

  • [Hadoop] Hadoop安装配置snappy压缩 日期:2016-06-10 01:17:39 点击:199 好评:0

    本文的主要详细介绍hadoop2.x中snappy压缩算法安装配置的详细步骤。 [一]、 实验环境 CentOS 6.3 64位 Hadoop 2.6.0 JDK1.7.0_75 [二]、 snappy编译安装 2.1、下载源码 到官网http://code.google.com/p/snappy/或者到https://github.com/google/snappy下载源...

  • [Hadoop] HBase+Hadoop2 NN HA+Zookeeper独立安装的整合 日期:2016-06-10 01:16:46 点击:124 好评:0

    Hadoop2 NN HA+Zookeeper独立安装的步骤参见:http://www.micmiu.com/bigdata/hadoop/hadoop2-cluster-ha-setup/,本文HBase的整合是在此环境搭建好的基础上进行的。 1、各节点的角色分配 hostname IP Hadoop角色 HBase角色 nn1.hadoop zk1.hadoop 172.17.22...

  • [Hadoop] Hadoop2分布式及NN和RM实现HA的实验 日期:2016-06-10 01:10:21 点击:171 好评:0

    目录结构 引言 实验环境 实验过程 演示demo [一]、 引言 在Hadoop2.x初期的时候写过一篇hadoop 2.2.0 集群模式安装配置和测试,记录了分布式搭建的最基本的搭建步骤和运行演示,那篇文章中没有对HA的配置做实验,本文会详细介绍 Hadoop2的分布式、NameNode配...

  • [Hadoop] hadoop管理 日期:2016-06-10 00:01:27 点击:194 好评:0

    1. hdfs基本统计情况 fs是个比较抽象的层面,在分布式环境中,fs就是dfs,但在本地环境中,fs是local file system,这个时候dfs就不能用。 hadoop dfsadmin -report 2. hadoop安全模式 NameNode在启动时会自动进入安全模式。安全模式是NameNode的一种状态,在...

  • [Hadoop] Hadoop三种安装模式 日期:2016-06-09 23:56:05 点击:93 好评:0

    Hadoop三种安装模式:单机模式,伪分布式,真正分布式 一 单机模式standalone 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Had...

  • [Hadoop] 伪分布模式下执行wordcount实例时报错解决办法 日期:2016-06-09 23:55:18 点击:117 好评:0

    问题1、不能分配内存,错误提示如下: FAILED java.lang.RuntimeException: Error while running command to get file permissions : java.io.IOException: Cannot run program /bin/ls: java.io.IOException: error=12, Cannot allocate memory at java.lang...

  • [Hadoop] 安装hadoop2.4.0遇到的问题 日期:2016-06-09 23:53:57 点击:101 好评:0

    一、执行start-dfs.sh后,datenode没有启动 查看日志如下: 2014-06-18 20:34:59,622 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for block pool Block pool registering (Datanode Uuid unassigned) service to localh...

  • [Hadoop] Eclipse下搭建Hadoop2.4.0开发环境 日期:2016-06-09 23:53:51 点击:200 好评:0

    一、安装Eclipse 下载Eclipse,解压安装,例如安装到/usr/local,即/usr/local/eclipse 4.3.1版本下载地址:http://pan.baidu.com/s/1eQkpRgu 二、在eclipse上安装hadoop插件 1、下载hadoop插件 下载地址:http://pan.baidu.com/s/1mgiHFok 此zip文件包含了...

  • [Hadoop] 一、Ubuntu14.04下安装Hadoop2.4.0 (单机模式) 日期:2016-06-09 23:52:02 点击:89 好评:0

    一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。 1、创建hadoop用户组 2、创建hadoop用户 sudo adduser -ingroup hadoop hadoop 回车后会提示输入新的UNIX密码,这是新...

  • [Hadoop] 二、Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式) 日期:2016-06-09 23:50:13 点击:173 好评:0

    在Ubuntu14.04下安装Hadoop2.4.0(单机模式)基础上配置 一、配置core-site.xml /usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。 编辑器中打开此文件 sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml 在该文件的configu...

  • [Hadoop] ubuntu + hadoop2.5.2分布式环境配置 日期:2016-06-09 23:46:37 点击:62 好评:0

    我之前有详细写过hadoop-0.20.203.0rc1版本的环境搭建 hadoop学习笔记环境搭建 http://www.cnblogs.com/huligong1234/p/3533382.html 本篇部分细节就不多说。 一、基础环境准备 系统:(VirtualBox) ubuntu-12.04.2-desktop-i386.iso hadoop版本:hadoop-2.5....

  • [Hadoop] CentOS 6.4 编译 Hadoop 2.5.1 日期:2016-06-09 15:33:27 点击:56 好评:0

    1 前提准备 建议关闭编译机器上的防火墙与SELinux。 需要保证编译机器可以访问互联网。 卸载机器上的OpenJDK,并安装上64位的Oracle JDK。此处选用JDK7。 注意:经过实践,直到Hadoop 2.6.3使用JDK8进行编译依然存在出现各种问题。理论上应该可以解决,可是...

  • [Hadoop] Hadoop CDH5 Impala部署 日期:2016-05-29 23:24:40 点击:137 好评:0

    Cloudera发布了实时查询开源项目Impala!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。 CDH5 Impala 安装 1impala由四部分组成: impalad - Impala的守护进程. 计划执...

  • [Hadoop] Hadoop CDH5 Spark部署 日期:2016-05-29 23:24:05 点击:133 好评:0

    Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速,Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分...

  • [Hadoop] hadoop云框架配置方案 日期:2016-05-26 13:29:58 点击:57 好评:0

    虽然和GOOGLE的云计算框架相差很远,但是基本能够实现云框架还是可以的,我选择了hadoop,最近这个框架在网络上炒的很火,一部分IT高手加入了开发队列,本人也不例外(不过我不是高手,只是一个很普通的系统架构师而已)。 好了废话少说,直接切入主题吧 首先使...

  • [Hadoop] hadoop原理浅析及安装 日期:2016-05-26 13:28:00 点击:113 好评:0

    经过几天的测试,hadoop分布式系统搭建完毕。首先说一下这几天对hadoop理论知识的理解,然后说一下安装及碰到的问题。有图有真相http://192.168.0.20:50070/dfshealth.jsp 第一:理论知识: 什么是hadoop: 由三部分组成:HDFS,MapReduce和Hbase。 维基百科...

  • [Hadoop] HDFS 常用的文件操作命令 日期:2016-05-26 13:25:56 点击:185 好评:0

    1.-cat 使用方法:hadoop fs -cat URI 说明:将路径指定的文件输出到屏幕 示例: hadoop fs -cat hdfs://host1:port1/file hadoop fs -cat file:///file3 2.-copyFromLocal 使用方法:hadoop fs -copyFromLocal localsrcURI 说明: 将本地文件复制到 HDFS 中...

栏目列表
推荐内容