作为Hadoop领域首家提交IPO资料的创业公司,Hortonworks公司本周四将发行价格定在了16美元,比公司最初的预估价(12-14美元)中值高出了23%。 从公布的财报来看,Hortonworks的大多数收入都来自与其他科技厂商的技术合作和分销协议,最大的三家客户占到Hortonworks年时候入的37.4%,其中微 软一家客户的收入虽然呈下滑趋势,但依然占到Hortonworks2014年迄今收入的22.4%(与微软的合同2015年7月到期)。对于一家即将 IPO的科技企业来说,以上这些财务数据并不好看,Hortonworks距离盈利还很遥远,而且业务风险也不小。 Hadoop的未来不再是个问题 但是今天的投资者们普遍认为Hadoop依然是个高成长市场,物联网的蓬勃发展将农场、电力网络甚至宠物都变成了数据发生器,这意味着市场对Hadoop这样的后端大数据技术平台的需求将非常可观。 Hortonworks首席执行官Rob Bearden认为,Hadoop已经渡过了一个重要市场认知转折点,如今企业不再问否需要部署Hadoop,而是问什么投入多少,多快实施。 不过从目前各大市场研究公司给出的相互矛盾的调查结果来看,企业对Hadoop的认知和需求依然存在争议。例如有些调查显示不少企业的CIO们对Hadoop的产品概念感到困惑,也不知道如何将其融入自身的数据战略;但另外一些调查显示企业部署Hadoop的速度在加快,企业认为Hadoop将在数据战略中扮演重要角色。下面是Gartner关于企业大数据应用成熟度的调查数据:
下一步是数据湖和应用创新 让企业部署Hadoop系统只是大数据应用的第一步,Bearden认为随着企业将部门级Hadoop系统应用范围扩展到企业级,将各部门各种应用的数据汇集成所谓的“数据湖”,企业大数据市场将迎来下一个重要转折点。 数据湖的出现使下一代企业大数据应用成为可能,例如改进供应链运营的用户需求预测等,或者使用传感器数据提升物流效率。 Bearden认为数据湖和下一代企业大数据创新应用将在2015年进入爆发式增长阶段。
Hortonworks的YARN on Hadoop架构
YARN和云计算使一切成为可能 Bearden认为,Hadoop应用热潮与YARN的出现并非巧合,YARN作为Apache Hadoop的资源管理框架允许同一个集群运行多个不同类型的计算任务。例如,用户可以一边运行MapReduce批处理任务,同时与Spark上的机器学习应用互动,同时用Storm进行数据流实时处理。 两三年前,企业更多地在进行概念验证工作,或者在生产环境部署小规模集群,但去年开始,不少企业开始向数据湖架构升级,将Hadoop作为支柱系统使用,YARN的出现使这一切成为可能,其意义不亚于内燃机之于交通行业。 Hadoop的另外一个重大机遇是云计算,Hortonworks投入了大量工程资源确保其软件在企业自己的数据中心和云端都能同样运行。有了这种架构上的高度自由,企业能够根据需要和成本选择在本地或云端部署大数据应用,这是眼下大数据增长最快的需求。
企业对公共云端的大数据分析服务的需求调查 数据来源:Gigaom (责任编辑:IT) |