欢迎光临IT网Linux学习频道

当前位置: > Linux集群 > Hadoop >
  • [Hadoop] Hadoop命令大全 日期:2014-12-30 23:09:47 点击:164 好评:0

    1、列出所有Hadoop Shell支持的命令 $ bin/hadoop fs -help 2、显示关于某个命令的详细信息 $ bin/hadoop fs -help command-name 3、用户可使用以下命令在指定路径下查看历史日志汇总 $ bin/hadoop job -history output-dir 这条命令会显示作业的细节信息,...

  • [Hadoop] hadoop 2.2.0安装开发环境(单机伪分布模式) 日期:2014-12-30 23:08:30 点击:142 好评:0

    最近一直在自学Hadoop,今天花点时间搭建一个开发环境,并整理成文。 首先要了解一下Hadoop的运行模式: 单机模式(standalone) 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认...

  • [Hadoop] 腾讯大规模Hadoop集群实践 日期:2014-12-30 23:07:52 点击:206 好评:0

    TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。 TDW服务覆盖了腾讯绝大部分业务产品...

  • [Hadoop] hadoop 单机版部署步骤 日期:2014-12-30 23:06:39 点击:165 好评:0

    第一步:配置机器ip和网络环境,关闭防火墙,启动ssh服务 ,修改 /etc/hosts 使用setup命令 Firewall configuration disabled System services ssh 退出setup 执行命令:/sbin/service sshd start 修改/etc/hosts : vi/etc/hosts添加 192.168.128.135(虚拟机IP)...

  • [Hadoop] hadoop2.4.1 fs shell 日期:2014-12-30 23:05:43 点击:151 好评:0

    转载地址: http://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-common/FileSystemShell.html Overview appendToFile cat chgrp chmod chown copyFromLocal copyToLocal count cp du dus expunge get getfacl getmerge ls lsr mkdir moveFrom...

  • [Hadoop] Hadoop Shell命令 日期:2014-12-30 23:05:11 点击:82 好评:0

    FS Shell cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text touchz FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs args的形式。 所有的的...

  • [Hadoop] hadoop2.4.1_WordCount测试 日期:2014-12-30 23:04:27 点击:118 好评:0

    hadoop2.4.1完全分布式安装:http://blog.itpub.net/26613085/viewspace-1219710/ [hadoop@master mapreduce]$ hadoop fs -ls /input 14/07/18 09:31:08 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using buil...

  • [Hadoop] hadoop2.4.1完全分布式安装 日期:2014-12-30 23:03:54 点击:134 好评:0

    本文(亲测实录)主要列出在安装hadoop 2.4.1过程中各个文件配置情况,其他步骤请参考网络其他资源进行操作 1、JDK安装和SSH互信(略过) 2、各节点IP和hostname如下(各节点需配置) [hadoop@master ~]$ cat /etc/hosts 127.0.0.1 localhost 100.12.56.221...

  • [Hadoop] 超详细单机版搭建hadoop环境图文解析 日期:2014-12-30 01:54:08 点击:185 好评:0

    前言: 年前,在老大的号召下,我们纠集了一帮人搞起了hadoop,并为其取了个响亮的口号云在手,跟我走。大家几乎从零开始,中途不知遇到多少问题,但终 于在回家之前搭起了一个拥有12台服务器的集群,并用命令行在该集群上运行了一些简单的mapreduce程序。想...

  • [Hadoop] hbase+hive应用场景 日期:2014-12-30 01:53:19 点击:79 好评:0

    一.Hive应用场景 本文主要讲述使用 Hive 的实践,业务不是关键,简要介绍业务场景,本次的任务是对搜索日志数据进行统计分析。 集团搜索刚上线不久,日志量并不大 。这些日志分布在 5 台前端机,按小时保存,并以小时为周期定时将上一小时产生的数据同步到日...

  • [Hadoop] 用hdfs存储海量的视频数据的设计思路 日期:2014-12-30 01:52:53 点击:131 好评:-2

    用hdfs存储海量的视频数据 存储海量的视频数据,主要考虑两个因素:如何接收视频数据和如何存储视频数据。 我们要根据数据block在集群上的位置分配计算量,要充分利用带宽的优势。 1.接收视频数据 将从摄像头接收到的或通过模拟产生的视频流以文件的形式存...

  • [Hadoop] hadoop的hdfs文件操作实现上传文件到hdfs 日期:2014-12-30 01:52:22 点击:135 好评:0

    这篇文章主要介绍了使用hadoop的API对HDFS上的文件访问,其中包括上传文件到HDFS上、从HDFS上下载文件和删除HDFS上的文件,需要的朋友可以参考下 hdfs文件操作操作示例,包括上传文件到HDFS上、从HDFS上下载文件和删除HDFS上的文件,大家参考使用吧 复制代码...

  • [Hadoop] 关于Hadoop结合RDBMS应用的一些思考 日期:2014-12-30 01:52:03 点击:190 好评:0

    最近一段时间一直在从事和hadoop相关的工作,主要是技术内容学习、安装配置优化以及一些框架结构的设计。在此期间,我对于RDBMS和Hadoop的结合应用有了一些自己的看法,写出来大家共同探讨一下。 1、为什么要用Hadoop 这个在网上已近有很多的人说过这个问题...

  • [Hadoop] HadoopDB:混合分布式系统 日期:2014-12-30 01:50:13 点击:191 好评:0

    HadoopDB 是一个 Mapreduce 和传统关系型数据库的结合方案,以充分利用 RDBMS 的性能和 Hadoop 的容错、分布特性。2009 年被 Yale 大学教授 Abadi 提出,继而商业化为 Hadapt,据称从 VC 那儿拉到了 10M 刀投资。 本文是对 HadoopDB 论文的总结。其中不免掺...

  • [Hadoop] hadoop安装与WordCount例子 日期:2014-12-30 01:35:38 点击:64 好评:0

    1、JDK安装 下载网址: http://www.oracle.com/technetwork/java/javase/downloads/jdk-6u29-download-513648.html 如果本地有安装包,则用SecureCRT连接Linux机器,然后用rz指令进行上传文件; 下载后获得jdk-6u29-linux-i586-rpm.bin文件,使用sh jdk-6u29-...

  • [Hadoop] centos6下安装部署hadoop2.2 日期:2014-12-30 01:32:30 点击:153 好评:2

    环境准备 1、操作系统:centos6.0 64位 2、hadoop版本:hahadoop-2.2.0 安装和配置步骤具体如下: 1、主机和ip分配如下 ip地址 主机名 用途 192.168.1.112 hadoop1 namenode 192.168.1.113 hadoop2datanode 192.168.1.114 hadoop3 datanode 192.168.1.115 had...

  • [Hadoop] Hadoop 2.0+YARN启动脚本分析与实战经验 日期:2014-12-30 01:31:59 点击:186 好评:0

    start-all.sh脚本现在已经废弃,推荐使用start-dfs.sh和start-yarn.sh分别启动HDFS和YARN。 在新一代的Hadoop里面HDFS称为了统一存储的平台,而YARN成为了统一计算的平台。 (1)调用start-dfs.sh启动HDFS。之后JPS会出现NameNode,DataNode,SecondaryNameNod...

  • [Hadoop] no datanode to stop 日期:2014-12-30 01:31:34 点击:175 好评:0

    昨晚整了半天,遇上的问题是通过start-all.sh无法启动datanode,然后关闭时就会报no datanode to stop ,引起这个的原因是因为我多次格式化,导致namespaceID不一致,解决方法也就简单了,修改Salve里的current/VERSION里的namespaceID,将其设置成与namenode...

  • [Hadoop] hadoop 关闭进程时报错no 进程 to stop 日期:2014-12-30 01:31:00 点击:161 好评:0

    翻看了yarn-deamon.sh stop部分的脚本: (stop) if[-f$pid];then TARGET_PID=`cat$pid` ifkill-0$TARGET_PID/dev/null21;then echostopping$command kill$TARGET_PID sleep$YARN_STOP_TIMEOUT ifkill-0$TARGET_PID/dev/null21;then echo$commanddidnotstopgr...

  • [Hadoop] Hadoop平台配置总结 日期:2014-12-30 01:30:24 点击:91 好评:0

    hadoop的配置,个人感觉是非常容易出问题。一个原因是要配置的地方多,还有个原因就是集群配置要在几台机器上都配置正确,才能保证配置好hadoop,跑起任务。 经过昨晚加今天上午的折腾,总算成功配好了集群模式,其中苦不堪言啊,中间好几次都想要放弃。这里...

  • [Hadoop] Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程 日期:2014-12-29 17:45:19 点击:202 好评:0

    历时一周多,终于搭建好最新版本Hadoop2.2集群,期间遇到各种问题,作为菜鸟真心被各种折磨,不过当wordcount给出结果的那一刻,兴奋的不得了~~(文当中若有错误之处或疑问欢迎指正,互相学习) 另外:欢迎配置过程中遇到问题的朋友留言,相互讨论,并且能够...

  • [Hadoop] Ubuntu上使用Hadoop2.x七HDFScluster使用 日期:2014-12-25 22:14:00 点击:189 好评:0

    namenode管理站点 首先namenode有一个web站点,默认端口号是50070, 下面是我的截屏: 至少说明namenode服务启动正常了。 日志 网站上Utilities-Log里面可以看到namenode的日志信息。包括启动的时候Java的版本,参数等等。 也可以看到复制文件t.txt的操作:...

  • [Hadoop] Hadoop0.20.2+Ubuntu13.04配置和WordCount测试 日期:2014-12-25 22:12:17 点击:165 好评:0

    其实这篇博客写的有些晚了,之前做过一些总结后来学校的事给忘了,这几天想重新拿来玩玩发现有的东西记不住了,翻博客发现竟然没有,好吧,所以赶紧写一份留着自己用吧,这东西网上有很多,不过也不是完全适用,所以还是自己留一份吧,废话完毕。 因为之前留...

  • [Hadoop] Ubuntu12.04上使用Hadoop2.2.0 用户权限设置 日期:2014-12-25 22:10:47 点击:177 好评:0

    本文介绍安装Hadoop 2.2.0 single node。 首先准备一个虚拟机,Ubuntu 12.04.4 Java环境: 1.root@hm1:~# mvn --version 2.Apache Maven3.1.1(0728685237757ffbf44136acec0402957f723d9a;2013-09-1715:22:22+0000) 3.Maven home: /usr/apache-maven-3.1.1 4....

  • [Hadoop] hadoop分布式集群搭建 日期:2014-12-21 19:41:16 点击:174 好评:0

    hadoop版本:hadoop-0.20.205.0-1.i386.rpm 下载地址:http://www.fayea.com/apache-mirror/hadoop/common/hadoop-0.20.205.0/ jdk版本:jdk-6u35-linux-i586-rpm.bin 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk6u35-downloads-...

  • [Hadoop] Hadoop常用配置总结 日期:2014-12-21 19:34:55 点击:112 好评:0

    Hadoop守护进程日志存放目录:可以用环境变量${Hadoop_LOG_DIR}进行配置,默认情况下是${HADOOP_HOME}/logs 1.配置类型节点的环境变量 在配置集群的时候可以在conf/hadoop-env.sh配置不同节点的环境变量: Daemon ConfigureOptions NameNode HADOOP_NAMENOD...

  • [Hadoop] hadoop 优化0 日期:2014-12-21 19:34:27 点击:144 好评:0

    1.hadoop-env.sh:该文件用来配置hadoop所需的特殊环境变量: JAVA与HADOOP环境变量的设置(如果在~/.bash_profile中设置了环境变量,这里可以不进行配置) export JAVA_HOME=/home/admin/deploy/java6 exportHADOOP_HOME=/home/admin/deploy/hadoop-0.20.2...

  • [Hadoop] Hadoop集群作业调度算法 日期:2014-12-21 19:33:36 点击:114 好评:0

    Hadoop集群中有三种作业调度算法,分别为FIFO,公平调度算法和计算能力调度算法 先来先服务(FIFO) FIFO比较简单,hadoop中只有一个作业队列,被提交的作业按照先后顺序在作业队列中排队,新来的作业插入到队尾。一个作业运行完后,总是从队首取下一个作业...

栏目列表
推荐内容