hadoop mahout 算法和API说明
时间:2015-05-11 02:45 来源:linux.it.net.cn 作者:IT

org.apache.mahout.cf.taste.hadoop.item.RecommenderJob.main(args)
--input
偏好数据路径,文本文件。格式 userid\t itemid\t preference
--output
推荐结果路径
-- numRecommendations
推荐个数
--usersFile
需要做出推荐的user,默认全部做推荐
--itemsFile
需要做出推荐的item,默认全部做推荐
--filterFile
文件格式文本,userid\itemid 。目的是给userid的用户不要推荐itemid的item
--booleanData
是否是布尔数据
--maxPrefsPerUser
最大偏好值
--minPrefsPerUser
最小偏好值
--maxSimilaritiesPerItem
给每一个Item计算最多的相似item数目
--maxPrefsPerUserIn ItemSimilarity
ItemSimilarity估计item相似度时,对每一个user最多偏好数目
--similarityClassname
SIMILARITY_PEARSON_CORRELATION、 SIMILARITY_COOCCURRENCE、SIMILARITY_LOGLIKELIHOOD、 SIMILARITY_TANIMOTO_COEFFICIENT、SIMILARITY_CITY_BLOCK、SIMILARITY_COSINE、 SIMILARITY_EUCLIDEAN_DISTANCE
--threshold
删除低于该阈值的item对
--outputPathForSimilarityMatrix
指定生成的item相似矩阵路径,文本文件,格式为 itemA \t itemB \t 相似值
(责任编辑:IT)
(责任编辑:IT) |