我有这样的数据(实际数据中有10000行(:
性别 | 父母 | 就业年龄范围 | >折扣||
---|---|---|---|---|
0 | 女性 | 是全职30-39 | 否||
1 | 男 | 否兼职 | >40-49 | 是 |
2 | 其他 | 是全职 | 30-39 | 否|
3 | 女性 | 是失业 | 30-49 | >是|
男 | 是 | 兼职40-49是 | ||
5 | 女性 | 无全职 | <20-29>>>无 | |
男 | 是 | 兼职50-59 | >是||
7 | 女性 | 无失业 | >30-39 | <1td>无
您必须将这些分类值转换为伪值或数值值。因此,在性别的情况下,将女性更改为1,将男性更改为0。在因变量的情况下,Yes为1,No为0。对每个字符串值项执行此操作应该会返回所需的结果。