在mahout中输出项目-项目相似性矩阵



我遵循了Mahout in Action文本书第6章中给出的推荐引擎示例。现在,当我获得指定用户的输出时,现在可以输出在第三次Map reduce作业期间计算的项目-项目相似性矩阵。MapReduce作业完成后,我发现存在一个temp文件夹,其中包含一个名为/user/hduser/temp/similarityMatrix的目录,但在执行
hadoop fs -cat temp/similarityMatrix/part-r-00000我得到

SEQ org.apache.hadoop.io.IntWritable%org.apache.mahout.math.VectorWritable�h��8��Oh�pg;Q����@@����@@2����?�����@����?�&����@?�?�&   ����?�@?�&
                      ����?�?�@+�"���������?��D?�?�t�"�����
����@�?��?��?��?�?�����?�?��?��?�|�"�����
                                                    ����@(@�?��"?��?��?��?�
?�J?�΍��?��?�B�"���������?��M?�Ї��?��$?�!?�L�"�����!����@(@"�?�?�&?��@�?��?��@0@!?�)?�� ?��
                                   ?��
                                      ?��?��?�?�k?��?��ӯ�?��?��?�(?�?�F?�'?�!?��
     ?�

是否可以以任何方式输出项目-项目相似性矩阵?

这是一个hadoop序列文件,二进制格式。你需要编写代码才能使用它。试着用mahout-seqdumper检查它的内容。

最新更新