数据帧上的摘要显示字符字段的主要值。当我在其上应用 substr 时:我收到"useless"信息



我是R语言的初学者。

我已将Excel工作表加载到数据帧中。 摘要向我显示这些信息:

summary(dat)
APE                                                          LIBELLE       EFFECTIF  
8110Z  :638   Activités combinées de soutien lié aux bâtiments        :638   1,5    :664  
2370Z  :  8   Commerce de gros de bois et de matériaux de construction:  8   4      : 57  
4511Z  :  8   Commerce de voitures et de véhicules automobiles légers :  8   34,5   : 37  
4673A  :  8   Hôtels et hébergement similaire                         :  8   14,5   : 36  
5510Z  :  8   Taille, façonnage et finissage de pierres               :  8   7,5    : 24  
2363Z  :  6   Fabrication de béton prêt à l'emploi                    :  6   74,5   : 17  
(Other):181   (Other)                                                 :181   (Other): 22 

APE代码(我认为现在是欧洲NACE代码,但该字段有一个旧名称(太详细了,只有五个字符。我执行此语句以仅考虑其前两个字符:

dat$APE <- substr(dat$APE, 1, 2)

然后,summary命令没有向我显示我预期的结果:

summary(dat)
APE                                                                LIBELLE       EFFECTIF  
Length:857         Activités combinées de soutien lié aux bâtiments        :638   1,5    :664  
Class :character   Commerce de gros de bois et de matériaux de construction:  8   4      : 57  
Mode  :character   Commerce de voitures et de véhicules automobiles légers :  8   34,5   : 37  
Hôtels et hébergement similaire                         :  8   14,5   : 36  
Taille, façonnage et finissage de pierres               :  8   7,5    : 24  
Fabrication de béton prêt à l'emploi                    :  6   74,5   : 17  
(Other)                                                 :181   (Other): 22  

我期待 23, 45, 46, 55, 81... 在 APE 列中。

我不知道问题可能来自哪里,因为当我执行head命令时,一切似乎都很好。

head(dat)
APE                                                           LIBELLE EFFECTIF
1  02                                           Exploitation forestière        4
2  08 Extraction pierres ornement. construc. calcaire industriel, gypse     14,5
3  08        Exploit gravieres & sablieres, extraction argiles & kaolin     34,5
4  10             Préparation industrielle de produits à base de viande        4
5  10             Préparation industrielle de produits à base de viande      7,5
6  10                          Transformation et conservation de fruits     34,5

问候

@Roland感谢您的好回答。

dat$APE <- as.factor(substr(dat$APE, 1, 2))

成功地将字符串转换为纠正我的问题的因素。

最新更新