创建虚拟变量解决方法



我正在尝试从具有pd.get_dummies或Serie.get_dummies的列中创建虚拟变量,但是我立即收到内存错误错误。(我有大约 100 万行)。

该列如下所示:

      Col1
0     A | B
1       A
2     C | A
3     B | C

有没有办法绕过此错误? 使用另一个库或其他东西?

感谢您的帮助!

您可能

有兴趣尝试其他方法来对变量进行编码,如此处所述。您还可以查看此存储库,以实现本文中提到的各种方法。这是相同的文档。

否则,您将不得不分两次完成,正如 @Vivek Kumar 在他的评论中提到的。

您可以查看此 ,此和此以获取有关编码变量的替代方法的更多信息。

最新更新