我正在尝试从具有pd.get_dummies或Serie.get_dummies的列中创建虚拟变量,但是我立即收到内存错误错误。(我有大约 100 万行)。
该列如下所示:
Col1
0 A | B
1 A
2 C | A
3 B | C
有没有办法绕过此错误? 使用另一个库或其他东西?
感谢您的帮助!
您可能
有兴趣尝试其他方法来对变量进行编码,如此处所述。您还可以查看此存储库,以实现本文中提到的各种方法。这是相同的文档。
否则,您将不得不分两次完成,正如 @Vivek Kumar 在他的评论中提到的。
您可以查看此 ,此和此以获取有关编码变量的替代方法的更多信息。