Hadoop生态图谱

高级搜索|网站地图|TAG标签 RSS订阅[设为首页] [加入收藏]

当前位置: > Linux集群 > Hadoop >

Hadoop生态图谱

时间:2016-11-27 02:25来源:linux.it.net.cn 作者:IT

当下Hadoop已经成长为一个庞大的体系，貌似只要和海量数据相关的，没有哪个领域缺少Hadoop的身影，下面是一个Hadoop生态系统的图谱，详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

这一切，都起源自Web数据爆炸时代的来临
数据抓取系统－ Nutch
海量数据怎么存，当然是用分布式文件系统－ HDFS
数据怎么用呢，分析，处理
MapReduce框架，让你编写代码来实现对大数据的分析工作
非结构化数据（日志）收集处理－ fuse,webdav, chukwa, flume, Scribe
数据导入到HDFS中，至此RDBSM也可以加入HDFS的狂欢了－ Hiho, sqoop
MapReduce太麻烦，好吧，让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
让你的数据可见－ drilldown, Intellicus
用高级语言管理你的任务流 – oozie, Cascading
Hadoop当然也有自己的监控管理工具 – Ambari, Hue, karmasphere, eclipse plugin, cacti, ganglia
数据序列化处理与任务调度 – Avro, Zookeeper
更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce
OLTP存储系统 – Hbase

retail2

http://hortonworks.com/blog/modern-retail-architectures-built-hadoop/

telco-hadoop-architecture

http://hortonworks.com/blog/modern-telecom-architectures-built-hadoop/

REF：

http://www.neevtech.com/blog/2013/03/18/hadoop-ecosystem-at-a-glance/

(责任编辑：IT)

------分隔线----------------------------

上一篇：HDFS的架构和设计要点
下一篇：机器重启hadoop报错：FSNamesystem initialization failed

栏目列表

推荐内容

Hadoop2.X/YARN环境搭建--CentOS7.0系统配置
Hadoop原本来自于谷歌一款名为MapReduce的编程模型包。谷歌的MapReduce框架可以把一个...

热点内容