我一直试图通过以下方式使用灰盒关联来查找数据集中所有分类和数字之间的相关性-
library(readxl)
library(timeDate)
library(greybox)
library(dplyr)
library(mice)
library(Hmisc)
carData33 <- read.csv("carData.csv")
#removing the first column since its not necessary, it represents the ID number
carData33 <- carData33[,c(2:15)]
#replacing NA with 0
carData33[is.na(carData33)] <-0
assoc(carData33)
主要目的是通过选择具有相关值的变量来进行回归。
Bt在这样做的时候,弹出的错误是-
Error in .lm.fit(x, y) : NA/NaN/Inf in 'x'
In addition: Warning message:
In .lm.fit(x, y) : NAs introduced by coercion
数据集如下-https://i.stack.imgur.com/ZhjwR.png
在包含分类数据的列上使用as.factor((。类似test$manufacturer <- as.factor(test$manufacturer)