我遵循了Mahout in Action文本书第6章中给出的推荐引擎示例。现在,当我获得指定用户的输出时,现在可以输出在第三次Map reduce作业期间计算的项目-项目相似性矩阵。MapReduce作业完成后,我发现存在一个temp
文件夹,其中包含一个名为/user/hduser/temp/similarityMatrix
的目录,但在执行
时hadoop fs -cat temp/similarityMatrix/part-r-00000
我得到
SEQ org.apache.hadoop.io.IntWritable%org.apache.mahout.math.VectorWritable�h��8��Oh�pg;Q����@@����@@2����?�����@����?�&����@?�?�& ����?�@?�&
����?�?�@+�"���������?��D?�?�t�"�����
����@�?��?��?��?�?�����?�?��?��?�|�"�����
����@(@�?��"?��?��?��?�
?�J?���?��?�B�"���������?��M?�Ї��?��$?�!?�L�"�����!����@(@"�?�?�&?��@�?��?��@0@!?�)?�� ?��
?��
?��?��?�?�k?��?��ӯ�?��?��?�(?�?�F?�'?�!?��
?�
是否可以以任何方式输出项目-项目相似性矩阵?
这是一个hadoop序列文件,二进制格式。你需要编写代码才能使用它。试着用mahout-seqdumper检查它的内容。