Hadoop源码解读之(一) NameNode
时间:2014-12-02 15:34 来源:linux.it.net.cn 作者:IT
正如大多数源码解读,第一篇为NameNode的解析。
首先将NameNode注释翻译一下,大概意思如下:
1.NameNode 服务器有两个作用:
a.目录名称空间的管理者
b.维护 hadoop 分布式系统的“inode table”
2.NameNode维护着两个关键的对应关系
a.文件名和block 块
b.block 块和其对应的存储机器
其中:第一个对应关系存储在磁盘中,第二个对应关系在每次NameNode启动的时候被加载到内存中。
3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理
4.NameNode实现了3个接口:
a.ClientProtocol:允许Client请求服务,但是ClientProtocol不是被用来让最终用户使用的,最终用户使用FileSystem来对HDFS进行操作。
b.DatanodeProtocol:DataNode使用该接口来存储block块,这些方法被DataNode调用。
c.NamenodeProtocol:该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息,如局部的blockMap等。
----解释完注释,来看一下代码内容----
首先找见NameNode的构造函数
1
2
3
4
5
public NameNode(Configuration conf) throws IOException {
this(conf, NamenodeRole.NAMENODE);
}
protected NameNode(Configuration conf, NamenodeRole role)
throws IOException
可以看出最终NameNode实例化走的都是后者。
下面进入main方法:
找见最重要的一句话
1
2
3
NameNode namenode = createNameNode(argv, null);
点进去,然后是switch代码块,这里就是我们在命令行里面敲hdfs dfs -X的解析部分。
(责任编辑:IT)
正如大多数源码解读,第一篇为NameNode的解析。 首先将NameNode注释翻译一下,大概意思如下: 1.NameNode 服务器有两个作用: a.目录名称空间的管理者 b.维护 hadoop 分布式系统的“inode table” 2.NameNode维护着两个关键的对应关系 a.文件名和block 块 b.block 块和其对应的存储机器 其中:第一个对应关系存储在磁盘中,第二个对应关系在每次NameNode启动的时候被加载到内存中。 3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理 4.NameNode实现了3个接口: a.ClientProtocol:允许Client请求服务,但是ClientProtocol不是被用来让最终用户使用的,最终用户使用FileSystem来对HDFS进行操作。 b.DatanodeProtocol:DataNode使用该接口来存储block块,这些方法被DataNode调用。 c.NamenodeProtocol:该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息,如局部的blockMap等。
----解释完注释,来看一下代码内容----
首先找见NameNode的构造函数
可以看出最终NameNode实例化走的都是后者。 下面进入main方法: 找见最重要的一句话
(责任编辑:IT) |