我有向量v1,有26个元素,要么是"Live",要么是‘Non-Live’。当我使用tabulate(v1(时,它会返回
tabulate(v1)
Value Count Percent
cat1 0 0.00%
cat2 0 0.00%
Live 5 19.23%
Non-live 21 80.77%
这也会影响交叉表。如何防止制表和交叉表函数将向量中不存在的变量考虑在内?
从这里的例子中可以看出,如果变量不是分类的,那么可能会得到不在数据中的结果。请尝试将其转换为类别并再次运行tabulate
。
categorical_v1 = categorical(v1);
tabulate(categorical_v1)
看起来v1
可能已经是范畴的,但也许它没有正确设置,所以cat1
和cat2
是这个范畴的残余。"重新分类"数据应该会删除这些额外的类别。