小贝子编程

考虑到每个项目可以有多个主题，我如何将数据集中每个项目的主题转换为特征向量

本文关键字：项目集中数据集数据转换向量为特征考虑到 python machine-learning feature-extraction feature-selection feature-engineering
更新时间 : 2023-09-18
英文 : How do I convert topics for each item in the dataset into a feature vector, considering that each item can have more than 1 topic

我有一个包含英语语句的数据集。每个语句都被分配了一系列与该语句有关的主题。主题可以是经济、体育、政治、商业、科学等。每个陈述可以有一个以上的主题。有些语句可以有一个主题，有些语句可以具有两个主题，依此类推。对于语句本身，我使用TF-IDF向量将语句转换为特征向量。然而，我对如何将主题转换为用于机器学习训练的特征向量感到困惑。

您可以为每个主题创建一个二进制列，该列将显示语句是否具有此主题。

考虑到每个项目可以有多个主题，我如何将数据集中每个项目的主题转换为特征向量

相关内容

最新更新

热门标签：