欢迎光临IT网Linux学习频道

当前位置: > Linux集群 > Hadoop >
  • [Hadoop] hadoop开机启动普通用户脚本 日期:2015-03-26 21:40:16 点击:86 好评:0

    1.把hadoop、starthadoop.sh stophadoop.sh 拷贝/opt/下面 (注starthadoop.sh stophadoop.sh 是开启、关闭hadoop 脚本,可以根据目录不同更改) 2.把hadoop拷贝/etc/rc.d/init.d/下面 3.chmod 755 /opt/starthadoop.sh stophadoop.sh /etc/rc.d/init.d/hadoop...

  • [Hadoop] 创建cloudera hadoop本地源服务器 日期:2015-03-09 21:32:44 点击:158 好评:0

    在部署cloudera hadoop集群中,使用网络安装hadoop网速不太给力,需要创建一个本地源服务器,加速安装过程或者提高增加节点安装部署效率。 创建步骤 1. 如果是安装部署cloudera 4版本,需要先安装cloudera 源RPM文件 for redhat/ centos 5 64位服务器 rpm -Uv...

  • [Hadoop] fluentd结合kibana、elasticsearch实时搜索分析hadoop集群日志 日期:2015-03-09 21:31:26 点击:296 好评:0

    Fluentd是一个开源收集事件和日志系统,它目前提供150+扩展插件让你存储大数据用于日志搜索,数据分析和存储。 官方地址 http://fluentd.org/ 插件地址 http://fluentd.org/plugin/ Kibana 是一个为 ElasticSearch 提供日志分析的 Web ui工具,可使用它对日...

  • [Hadoop] CentOS6.5 安装 Hadoop 日期:2015-02-28 00:55:52 点击:198 好评:0

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set...

  • [Hadoop] Hadoop/Yarn/MapReduce内存分配(配置)方案 日期:2015-02-27 01:34:32 点击:184 好评:0

    以horntonworks给出推荐配置为蓝本,给出一种常见的Hadoop集群上各组件的内存分配方案。方案最右侧一栏是一个8G VM的分配方案,方案预留1-2G的内存给操作系统,分配4G给Yarn/MapReduce,当然也包括了HIVE,剩余的2-3G是在需要使用HBase时预留给HBase的。 Con...

  • [Hadoop] hadoop启动脚本解读 日期:2015-02-27 01:32:11 点击:187 好评:0

    本文以start-dfs.sh为例向下延展解释各脚本的作用和相互关系,对于start-yarn.sh同理可证。下图解释了各个脚本的作用: 注意:slaves.sh在通过SSH推送命令时,会首先读取$HADOOP_SLAVE_NAMES这个数组中的机器列表作为推送目标,当这个数组为空时才使用slaves...

  • [Hadoop] 配置NTP服务ntpd/ntp.conf(搭建Hadoop集群可参考) 日期:2015-02-27 01:28:16 点击:211 好评:0

    本文拟定是在一个局域网内(比如一个Hadoop集群)设定一台NTP服务器作为整个网络的标准时间参考,使用网络(集群)内的所有机器保持时间一致!以下是详细的操作步骤: 1. 修改选定的服务器的本地时间 #date -s 2014-11-21 12:48:30 +%F %T #2014-11-21 12:48:...

  • [Hadoop] 配置高可用的Hadoop平台 日期:2015-02-25 23:03:37 点击:85 好评:0

    1.概述 在Hadoop2.x之后的版本,提出了解决单点问题的方案--HA(High Available 高可用)。这篇博客阐述如何搭建高可用的HDFS和YARN,执行步骤如下: 创建hadoop用户 安装JDK 配置hosts 安装SSH 关闭防火墙 修改时区 ZK(安装,启动,验证) HDFS+HA的结...

  • [Hadoop] Hadoop jobhistory历史服务器介绍 日期:2015-02-23 23:27:21 点击:131 好评:0

    Hadoop自带了一个历史服务器,可以通过历史服务器查看已经运行完的Mapreduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下,Hadoop历史服务器是没有启动的,我们可以通过下面的命令来启动Had...

  • [Hadoop] 修改HDFS文件块大小 日期:2015-02-23 23:26:53 点击:121 好评:0

    1 通过Hadoop自带的WEB监控管理界面我们可以看到文件块的大小现在为64MB。 2 关闭集群 3 设置每个namenode节点和datanode节点的hdfs-site.xml文件,将文件中 的dfs.block.size属性值改为33554432(32M),重启集群 4 再次添加一个文件 会看到文件块的大小变...

栏目列表
推荐内容