当前位置: > Linux集群 > Hadoop >

Hadoop源码解读之(一) NameNode

时间:2014-12-02 15:34来源:linux.it.net.cn 作者:IT
正如大多数源码解读,第一篇为NameNode的解析。

    首先将NameNode注释翻译一下,大概意思如下:


    1.NameNode 服务器有两个作用:

        a.目录名称空间的管理者

        b.维护 hadoop 分布式系统的“inode table”

    2.NameNode维护着两个关键的对应关系

        a.文件名和block 块

        b.block 块和其对应的存储机器

        其中:第一个对应关系存储在磁盘中,第二个对应关系在每次NameNode启动的时候被加载到内存中。
    3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理


    4.NameNode实现了3个接口:

        a.ClientProtocol:允许Client请求服务,但是ClientProtocol不是被用来让最终用户使用的,最终用户使用FileSystem来对HDFS进行操作。
        b.DatanodeProtocol:DataNode使用该接口来存储block块,这些方法被DataNode调用。
        c.NamenodeProtocol:该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息,如局部的blockMap等。

----解释完注释,来看一下代码内容----
    首先找见NameNode的构造函数


1
2
3
4
5
    public NameNode(Configuration conf) throws IOException {
    this(conf, NamenodeRole.NAMENODE);
  }
    protected NameNode(Configuration conf, NamenodeRole role) 
      throws IOException
 


    可以看出最终NameNode实例化走的都是后者。


    下面进入main方法:


    找见最重要的一句话 
1
2
3
NameNode namenode = createNameNode(argv, null);

    点进去,然后是switch代码块,这里就是我们在命令行里面敲hdfs dfs -X的解析部分。
 

(责任编辑:IT)
------分隔线----------------------------