注释的群集列表



我是一个初学者,刚刚发现了伟大的 Carrot2 框架。

我尝试使用Java API使用LingoClusteringAlgorithm对Facebook评论列表(~100条评论,大约10-200个字符)进行聚类。我是否可以将注释文本用作"标题"字段,并将字段"摘要"、"网址"和"查询"留空?或者有没有更好的方法(例如,对"标题"和"片段"使用两次注释文本?

"title"或"snippet"中至少有一个必须为非空,因此您可以将帖子文本放在"摘要"中,并将"title"留空。将"标题"或"片段"留空并不重要,两种情况下的结果都应该相同。

"url"字段仅用于显示目的,不会影响聚类的结果。如果您打算在 UI 中使用它,您可以将其留空或放置指向帖子的直接链接。

最新更新