python应用程序的数据集



我正在研究一个从症状预测疾病的应用程序,我在制作数据集时遇到了一些麻烦。如果有人有这方面的数据集,请将其链接到驱动器并在这里分享。另外,我有一个关于这个好的模型的问题(仅限sklearn)。我目前使用决策树分类器作为我的项目模型。如果你有什么建议,请提出来。谢谢你的阅读。编辑:得到解决方案

我看到你在寻找数据集时遇到了麻烦。我快速搜索了一下,在kaggle找到了这个。这需要预处理,因为许多症状在列中为空。也许您可以这样做,每一列都是一个特定的症状,如果出现(或不出现)症状,则值为1(或0)。这样做的问题是0的数量会非常多。你可以试试,看看它是否有效。

你也可以看到另一个实现Random Forest在这个环节中,采用了非常不同的预处理。它是决策树的一种高级模型。然而,决策树更易于解释,如果你需要的话。

相关内容

最新更新