streaming支持使用脚本作为map、reduce程序。以下介绍一个实现分布式的计算所有文件的总行数的程序
1. 待检索的数据放入hdfs
2. 编写map、reduce脚本,记得给脚本加可执行权限。
reducer.sh
3. 查看结果: |
streaming支持使用脚本作为map、reduce程序。以下介绍一个实现分布式的计算所有文件的总行数的程序
1. 待检索的数据放入hdfs
2. 编写map、reduce脚本,记得给脚本加可执行权限。
reducer.sh
3. 查看结果: |
Hadoop原本来自于谷歌一款名为MapReduce的编程模型包。谷歌的MapReduce框架可以把一个...