r-使用dummyVars()和ifelse()创建伪变量,有区别吗



我写这篇文章是为了询问创建或二进制化伪变量的常用方法。

我参考了很多不同的书,有两种方法:

使用封装caret下的dummyVars或使用ifelse

有人能分辨出其中的区别吗?

使用ifelse,没有直接/直观的方法为超过两个因素的变量创建伪变量。在这种情况下,ifelse对于简单的二进制变量最有用——是或否,某人吸烟与否。

另一方面,像dummyVarsdummy_cols这样的函数使您能够轻松地为具有多个因子的变量创建虚设。当你处理非二进制分类变量时,这些函数更容易接近,当你想在它们之间进行交互时,这也很方便。

最新更新