欢迎光临IT网Linux学习频道

当前位置: > Linux集群 >
  • [Hadoop] hadoop old API CombineFileInputFormat 日期:2015-05-11 02:49:32 点击:168 好评:0

    来自:http://f.dataguru.cn/thread-271645-1-1.html 简介 本文主要介绍下面4个方面 1.为什么要使用CombineFileInputFormat 2.CombineFileInputFormat实现原理 3.怎样使用CombineFileInputFormat 4.现存的问题 使用CombineFileInputFormat的目的 在开发M...

  • [Hadoop] hadoop multipleoutputs 日期:2015-05-11 02:49:08 点击:68 好评:0

    http://grepalex.com/2013/05/20/multipleoutputs-part1/ http://grepalex.com/2013/07/16/multipleoutputs-part2/...

  • [Hadoop] hadoop 文件合并 日期:2015-05-11 02:48:05 点击:121 好评:2

    众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。 1,getmerge hadoop有一个命令行工具getmerge,用于将一组HDFS上的文件复制到本地计算机以前进行合并 参考:http://hadoop.apa...

  • [Hadoop] hadoop-处理小文件 日期:2015-05-11 02:47:41 点击:71 好评:0

    一个Hadoop程序的优化过程 根据文件实际大小实现CombineFileInputFormat http://www.rigongyizu.com/hadoop-job-optimize-combinefileinputformat/ mapreduce job让一个文件只由一个map来处理 http://www.rigongyizu.com/mapreduce-job-one-map-process-one-...

  • [Hadoop] MapReduce实现大矩阵乘法 日期:2015-05-11 02:47:04 点击:78 好评:0

    引言 何 为大矩阵?Excel、SPSS,甚至SAS处理不了或者处理起来非常困难,需要设计巧妙的分布式方法才能高效解决基本运算(如转置、加法、乘法、求逆) 的矩阵,我们认为其可被称为大矩阵。这意味着此种矩阵的维度至少是百万级的、经常是千万级的、有时是亿万...

  • [Hadoop] Mahout 协同过滤 itemBase RecommenderJob源码分析 日期:2015-05-11 02:46:29 点击:114 好评:0

    Mahout支持2种 M/R 的jobs实现itemBase的协同过滤 I.ItemSimilarityJob II.RecommenderJob 下面我们对RecommenderJob进行分析,版本是mahout-distribution-0.7 源码包位置:org.apache.mahout.cf.taste.hadoop.item.RecommenderJob RecommenderJob前几个阶段...

  • [Hadoop] hadoop mahout 算法和API说明 日期:2015-05-11 02:45:56 点击:71 好评:0

    org.apache.mahout.cf.taste.hadoop.item.RecommenderJob.main(args) --input 偏好数据路径,文本文件。格式 userid\t itemid\t preference --output 推荐结果路径 -- numRecommendations 推荐个数 --usersFile 需要做出推荐的user,默认全部做推荐 --itemsF...

  • [Hadoop] Maven进行Mahout编程,使其兼容Hadoop2.2.0环境运行 (转) 日期:2015-05-11 02:45:18 点击:121 好评:0

    http://blog.csdn.net/u010967382/article/details/39209329 http://blog.csdn.net/fansy1990/article/details/23261633 先编译mahout源码让其支持hadoop2 再把本地仓储repository里的jar包替换成编译后的jar包 修改后的源码包(http://download.csdn.net/de...

  • [Hadoop] hadoop Mahout中相似度计算方法介绍(转) 日期:2015-05-11 02:44:16 点击:190 好评:0

    相似距离(距离越小值越大) 优点 缺点 取值范围 PearsonCorrelation 类似于计算两个矩阵的协方差 不受用户评分偏高 或者偏低习惯影响的影响 1. 如果两个item相似个数小于2时 无法计算相似距离. [可以使用item相似个数门限来解决.] 没有考虑两个用户之间的交集...

  • [Hadoop] mahout基于Hadoop的CF代码分析(转) 日期:2015-05-11 02:43:44 点击:58 好评:0

    来自:http://www.codesky.net/article/201206/171862.html mahout的taste框架是协同过滤算法的实现。它支持DataModel,如文件、数据库、NoSQL存储等,也支持Hadoop的MapReduce。这里主要分析的基于MR的实现。 基于MR的CF实现主要流程就在 org.apache.mahout...

  • 首页
  • 上一页
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 下一页
  • 末页
  • 81802
栏目列表
推荐内容