我正在寻找显示如何绘制文本分类决策边界的示例。我知道sklearn文档中的一些示例,但是如何将它们应用于文本数据呢?
我甚至不确定该画什么。可以为它绘制决策边界吗?
我正在考虑使用CountVectorizer的结果,然后将其转换为np.array。
网上有没有好的例子?
这里的困难在于文本分类是一个高维问题,其中维数等于词汇表的大小。在2d中绘制它需要首先应用降维技术,例如pca或t-sne,然后在这个新的表示上训练学习算法。尽管如此,我还是怀疑你的情节能提供多少信息。
你可以使用一个玩具示例,只有2-3个单词来可视化分隔类的线(2d)或面(3d),但它将是一个玩具示例。