• Hadoop源码解读之(一) NameNode

    日期:

    正如大多数源码解读,第一篇为NameNode的解析。 首先将NameNode注释翻译一下,大概意思如下: 1.NameNode 服务器有两个作用: a.目录名称空间的管理者 b.维护 hadoop 分布式系统的inode table 2.NameNode维护着两个关键的对应关系 a.文件名和block 块 b.block...

  • hive cli启动判断hadoop version的问题

    日期:

    测试环境的hive cli启动时报错: 1 Unable to determine Hadoop version information. hive是一个shell: 使用sh -x跟踪运行过程,可以看到其通过hadoop version获取hdfs的版本 相关的代码如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23...

  • hadoop常用服务管理命令

    日期:

    这几天正好在做cdh4.6.0到cdh5.2.0的升级测试,经常需要启动/关闭各种服务,简单看了下各个服务管理脚本,这里简单记录下: 主要的服务管理脚本如下 hdfs相关 1)hadoop-daemon.sh,可用于启动单一的服务 依次调用hadoop-config.sh和hadoop-env.sh 加载相关...

  • 如何构建日均千万PV Web站点 (一)

    日期:

    其实大多数互联网网站起初的网站架构都是(Linux+Apache+MySQL+PHP). 不过随着时代的发展,科技的进步.互联网进入寻常百姓家的生活。所谓的用户的需求,铸就了一个个互联网大牛;http://www.trueland.net/IndustryNews/gjszl.shtml 近日研究机构we are social...

  • LINUX 高可用群集之 Corosync

    日期:

    Corosync: 它属于OpenAIS(开放式应用接口规范)中的一个项目corosync一版本中本身不具 备投票功能,到了corosync 2.0之后引入了votequorum子系统也具备了投票功能了,如果我们用的是1版本的,又需要用到票数做决策时那该如何是好呢;当然,在红帽上把 cman +...

  • memcached的基础

    日期:

    memcached是什么? memcached 是以LiveJournal 旗下Danga Interactive 公司的Brad Fitzpatric 为首开发的一款软件。现在已成为mixi、hatena、Facebook、Vox、LiveJournal等众多服务中提高Web应用扩展性的重要因素。许多Web应用都将数据保存到RDBMS中,应用服...

  • memcached的内存存储

    日期:

    Slab Allocation机制:整理内存以便重复使用 memcached默认情况下采用了名为Slab Allocator的机制分配、管理内存。在该机制出现以前,内存的分配是通过对所有记录简单地进行malloc和free来进行的。但是,这种方式会导致内存碎片,加重操作系统内存管理器的负...

  • memcached的删除机制LRU

    日期:

    Lazy Expiration memcached内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。这种技术被称为lazy(惰性)expiration。因此,memcached不会在过期监视上耗费CPU时间。 LRU:从缓存中有效删除数据的原理 memcached会优先使用已超时...

  • memcached的分布式算法--一致性hash

    日期:

    memcached的分布式是什么意思? 下面假设memcached服务器有node1~node3三台,应用程序要保存键名为 tokyo、kanagawa、chiba、saitama、gunma的数据。 首先向memcached中添加tokyo。将tokyo传给客户端程序库后,客户端实现的算法就会根据键来决定保存数据的m...

  • Hadoop 2.5.1 集群安装配置

    日期:

    0. 服务说明 NameNode NameNode是HDFS的守护程序,负责记录文件是如何分割成数据块的,以及这些数据块被存储到哪些数据节点上。它的功能是对内存及I/O进行集中管理。 DataNode 集群中每个从服务器都运行一个DataNode后台程序,后台程序负责把HDFS数据块读写到...