Linux集群 / Hadoop

当前位置: > Linux集群 > Hadoop >

[Hadoop] hadoop开机启动普通用户脚本日期：2015-03-26 21:40:16 点击：86 好评：0
1.把hadoop、starthadoop.sh stophadoop.sh 拷贝/opt/下面 (注starthadoop.sh stophadoop.sh 是开启、关闭hadoop 脚本，可以根据目录不同更改) 2.把hadoop拷贝/etc/rc.d/init.d/下面 3.chmod 755 /opt/starthadoop.sh stophadoop.sh /etc/rc.d/init.d/hadoop...
[Hadoop] 创建cloudera hadoop本地源服务器日期：2015-03-09 21:32:44 点击：158 好评：0
在部署cloudera hadoop集群中，使用网络安装hadoop网速不太给力，需要创建一个本地源服务器，加速安装过程或者提高增加节点安装部署效率。创建步骤 1. 如果是安装部署cloudera 4版本，需要先安装cloudera 源RPM文件 for redhat/ centos 5 64位服务器 rpm -Uv...
[Hadoop] fluentd结合kibana、elasticsearch实时搜索分析hadoop集群日志日期：2015-03-09 21:31:26 点击：296 好评：0
Fluentd是一个开源收集事件和日志系统，它目前提供150+扩展插件让你存储大数据用于日志搜索，数据分析和存储。官方地址 http://fluentd.org/ 插件地址 http://fluentd.org/plugin/ Kibana 是一个为 ElasticSearch 提供日志分析的 Web ui工具，可使用它对日...
[Hadoop] CentOS6.5 安装 Hadoop 日期：2015-02-28 00:55:52 点击：198 好评：0
Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set...
[Hadoop] Hadoop/Yarn/MapReduce内存分配（配置）方案日期：2015-02-27 01:34:32 点击：184 好评：0
以horntonworks给出推荐配置为蓝本，给出一种常见的Hadoop集群上各组件的内存分配方案。方案最右侧一栏是一个8G VM的分配方案，方案预留1-2G的内存给操作系统，分配4G给Yarn/MapReduce，当然也包括了HIVE，剩余的2-3G是在需要使用HBase时预留给HBase的。 Con...
[Hadoop] hadoop启动脚本解读日期：2015-02-27 01:32:11 点击：187 好评：0
本文以start-dfs.sh为例向下延展解释各脚本的作用和相互关系，对于start-yarn.sh同理可证。下图解释了各个脚本的作用：注意：slaves.sh在通过SSH推送命令时，会首先读取$HADOOP_SLAVE_NAMES这个数组中的机器列表作为推送目标，当这个数组为空时才使用slaves...
[Hadoop] 配置NTP服务ntpd/ntp.conf（搭建Hadoop集群可参考）日期：2015-02-27 01:28:16 点击：211 好评：0
本文拟定是在一个局域网内（比如一个Hadoop集群）设定一台NTP服务器作为整个网络的标准时间参考，使用网络（集群）内的所有机器保持时间一致！以下是详细的操作步骤： 1. 修改选定的服务器的本地时间 #date -s 2014-11-21 12:48:30 +%F %T #2014-11-21 12:48:...
[Hadoop] 配置高可用的Hadoop平台日期：2015-02-25 23:03:37 点击：85 好评：0
1.概述在Hadoop2.x之后的版本，提出了解决单点问题的方案－－HA（High Available 高可用）。这篇博客阐述如何搭建高可用的HDFS和YARN，执行步骤如下：创建hadoop用户安装JDK 配置hosts 安装SSH 关闭防火墙修改时区 ZK（安装，启动，验证） HDFS＋HA的结...
[Hadoop] Hadoop jobhistory历史服务器介绍日期：2015-02-23 23:27:21 点击：131 好评：0
Hadoop自带了一个历史服务器，可以通过历史服务器查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下，Hadoop历史服务器是没有启动的，我们可以通过下面的命令来启动Had...
[Hadoop] 修改HDFS文件块大小日期：2015-02-23 23:26:53 点击：121 好评：0
1 通过Hadoop自带的WEB监控管理界面我们可以看到文件块的大小现在为64MB。 2 关闭集群 3 设置每个namenode节点和datanode节点的hdfs-site.xml文件，将文件中的dfs.block.size属性值改为33554432（32M），重启集群 4 再次添加一个文件会看到文件块的大小变...