如何使用机器学习算法训练和测试数据以进行分类



我从Twitter API收集了推文。推文没有标签,我不知道如何开始?所有教程都已标记数据。如何标记数据?标签只能手动完成吗?任何回答我的问题的好教程都会有很大帮助。

我假设当你从Twitter API中提取数据时,它是JSON格式的。使用键、值对作为数据帧标题和值。现在对于标签部分,这取决于您对数据集的处理方式。如果你想做情绪分析,那么你需要手动标记数据集(或者只是从互联网下载预先标记的Twitter数据集(。

作为参考,这里有一个关于如何挖掘和处理原始数据、获得洞察力和应用聚类算法的精彩教程。希望对您有所帮助!

相关内容

最新更新