HBase安装

时间:2016-06-09 23:59 来源:linux.it.net.cn 作者:IT

安全分布式安装
1. ssh秘钥登陆配置
2. DNS
HBase使用本地 hostname 才获得IP地址. 正反向的DNS都是可以的.如果你的机器有多个接口，HBase会使用hostname指向的主接口.如果还不够，你可以设置 hbase.regionserver.dns.interface 来指定主接口。当然你的整个集群的配置文件都必须一致，每个主机都使用相同的网络接口。还有一种方法是设置 hbase.regionserver.dns.nameserver来指定nameserver，不使用系统带的.
3. Lookback IP /etc/hosts
4. NTP 集群时钟要保持一致，稍有不一致是可以容忍的，但是很大的不一致会造成奇怪的行为。如有故障先检查时间是否一致。
5. ulimit 和 nproc
HBase是数据库，会在同一时间使用很多的文件句柄。大多数linux系统使用的默认值1024是不能满足的。
/etc/security/limits.conf 添加一行，如：
hadoop - nproc 32768
hadoop soft nproc 32000
hadoop hard nproc 32000
修改/etc/pam.d/login文件加上如下参数使limits.conf生效:
session required pam_limits.so
6. 将${HBASE_HOME}/lib目录下的hadoop-*.jar文件替换成Hadoop环境中的相应jar文件,以解决Hadoop版本冲突问题。
7. 配置.bash_profile
export JAVA_HOME=/usr/java/jdk1.6.0_37
export HADOOP_HOME=/usr/hadoop-1.2.0
export HBASE_HOME=/usr/hbase-0.95.1-hadoop1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin
8. 配置hbase-site.xml
<property>
<name>hbase.rootdir</name>
<value>hdfs://master.hadoop:9000/hbase</value>
<description>The directory shared by RegionServers.</description>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
<description>是否采用集群方式部署</description>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>slave1.hadoop,slave2.hadoop,slave3.hadoop</value>
<description>zookeeper的server地址 </description>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/export/zookeeper</value>
<description>Property from ZooKeeper's config zoo.cfg.The directory where the snapshot is stored.</description>
</property>
<property>
<name>dfs.support.append</name>
<value>true</value>
<description>确保再使用HDFS存储时，不出现数据遗失</description>
</property>
9. 配置hbase-env.sh
export JAVA_HOME=/usr/java/jdk1.6.0_37
export HBASE_MANAGES_ZK=true
export HBASE_HEAPSIZE=4096
注：zookeeper默认由hbase集成的方式部署，如果要想独立部署，需要在hbase-env.sh文件中，将HBASE_MANAGES_ZK设置成false
10. RegionServers
完全分布式模式的还需要修改conf/regionservers。列出了你希望运行的全部 HRegionServer，一行写一个host (就像Hadoop里面的 slaves 一样). 列在这里的server会随着集群的启动而启动，集群的停止而停止.
slave1.hadoop
slave2.hadoop
slave3.hadoop

(责任编辑：IT)