我写这篇文章是为了询问创建或二进制化伪变量的常用方法。
我参考了很多不同的书,有两种方法:
使用封装caret
下的dummyVars
或使用ifelse
有人能分辨出其中的区别吗?
使用ifelse
,没有直接/直观的方法为超过两个因素的变量创建伪变量。在这种情况下,ifelse
对于简单的二进制变量最有用——是或否,某人吸烟与否。
另一方面,像dummyVars
或dummy_cols
这样的函数使您能够轻松地为具有多个因子的变量创建虚设。当你处理非二进制分类变量时,这些函数更容易接近,当你想在它们之间进行交互时,这也很方便。