Hadoop源码解读之（一） NameNode_

> Linux集群 > Hadoop >

Hadoop源码解读之（一） NameNode

时间:2014-12-02 15:34 来源:linux.it.net.cn 作者:IT

正如大多数源码解读，第一篇为NameNode的解析。

首先将NameNode注释翻译一下，大概意思如下：

1.NameNode 服务器有两个作用：

      a.目录名称空间的管理者

      b.维护 hadoop 分布式系统的“inode table”

2.NameNode维护着两个关键的对应关系

      a.文件名和block 块

      b.block 块和其对应的存储机器

      其中：第一个对应关系存储在磁盘中，第二个对应关系在每次NameNode启动的时候被加载到内存中。
3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理

4.NameNode实现了3个接口：

      a.ClientProtocol：允许Client请求服务，但是ClientProtocol不是被用来让最终用户使用的，最终用户使用FileSystem来对HDFS进行操作。
      b.DatanodeProtocol：DataNode使用该接口来存储block块，这些方法被DataNode调用。
      c.NamenodeProtocol：该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息，如局部的blockMap等。

----解释完注释，来看一下代码内容----

首先找见NameNode的构造函数

1
2
3
4
5

public NameNode(Configuration conf) throws IOException {
this(conf, NamenodeRole.NAMENODE);
}
protected NameNode(Configuration conf, NamenodeRole role)
throws IOException

可以看出最终NameNode实例化走的都是后者。

下面进入main方法：

找见最重要的一句话

1
2
3

NameNode namenode = createNameNode(argv, null);

点进去，然后是switch代码块，这里就是我们在命令行里面敲hdfs dfs -X的解析部分。

(责任编辑：IT)