一种简单有效的分类机制是朴素贝叶斯分类器。你可以在那里找到几个开源的repos。一些例子是NLTK朴素贝叶斯分类器或Wink朴素贝叶斯文本分类器。
我有几个主题,我想对与这些主题匹配的单词进行分类。例如:
主题:"婚礼">
定义:";婚礼是两个人在婚姻中结合在一起的仪式">
Input word Score (assumed)
---------------------
husband 0.8
science 0.1
love 0.7
engage 0.9
... ...
我对主题分类很陌生。我不知道有什么方法可以有效地解决这个问题吗?