我是R语言的初学者。
我已将Excel工作表加载到数据帧中。 摘要向我显示这些信息:
summary(dat)
APE LIBELLE EFFECTIF
8110Z :638 Activités combinées de soutien lié aux bâtiments :638 1,5 :664
2370Z : 8 Commerce de gros de bois et de matériaux de construction: 8 4 : 57
4511Z : 8 Commerce de voitures et de véhicules automobiles légers : 8 34,5 : 37
4673A : 8 Hôtels et hébergement similaire : 8 14,5 : 36
5510Z : 8 Taille, façonnage et finissage de pierres : 8 7,5 : 24
2363Z : 6 Fabrication de béton prêt à l'emploi : 6 74,5 : 17
(Other):181 (Other) :181 (Other): 22
APE
代码(我认为现在是欧洲NACE
代码,但该字段有一个旧名称(太详细了,只有五个字符。我执行此语句以仅考虑其前两个字符:
dat$APE <- substr(dat$APE, 1, 2)
然后,summary
命令没有向我显示我预期的结果:
summary(dat)
APE LIBELLE EFFECTIF
Length:857 Activités combinées de soutien lié aux bâtiments :638 1,5 :664
Class :character Commerce de gros de bois et de matériaux de construction: 8 4 : 57
Mode :character Commerce de voitures et de véhicules automobiles légers : 8 34,5 : 37
Hôtels et hébergement similaire : 8 14,5 : 36
Taille, façonnage et finissage de pierres : 8 7,5 : 24
Fabrication de béton prêt à l'emploi : 6 74,5 : 17
(Other) :181 (Other): 22
我期待 23, 45, 46, 55, 81... 在 APE 列中。
我不知道问题可能来自哪里,因为当我执行head
命令时,一切似乎都很好。
head(dat)
APE LIBELLE EFFECTIF
1 02 Exploitation forestière 4
2 08 Extraction pierres ornement. construc. calcaire industriel, gypse 14,5
3 08 Exploit gravieres & sablieres, extraction argiles & kaolin 34,5
4 10 Préparation industrielle de produits à base de viande 4
5 10 Préparation industrielle de produits à base de viande 7,5
6 10 Transformation et conservation de fruits 34,5
问候
@Roland感谢您的好回答。
dat$APE <- as.factor(substr(dat$APE, 1, 2))
成功地将字符串转换为纠正我的问题的因素。