如何获取一组文档的距离矩阵



我正在尝试使用分层聚类对一组文档执行聚类。然而,我不确定如何获得一组文档的距离矩阵。有人能帮我吗?谢谢

  1. 决定使用哪些功能
  2. 提取特征
  3. 决定要使用的相似函数
  4. 计算成对相似性
  5. 将相似性转换为距离

最新更新