将复杂的宽数据转换为R中的长数据、多年列、相应的值、UTF-8问题(重复?)



我所拥有的是一种宽格式,需要以不同的方式重新整形和排序。我每年总共有10列,所有行都是同一年,每列的年份不同。我想把这些合并成一列,只表示年份。然而,其他连续列也按年份划分。例如,预算|预算(-1年(|预算(-2年(等,适用于19个不同类别。然后是ID列和类别列。

所以到目前为止,我已经尝试了plyr、整形和熔融替代品。真的不管用。除此之外,我认为还有一些UTF-8问题。

我已经很久没有尝试在R-studio中使用UTF-8字符了,但我不记得遇到过和现在一样的问题。我不断地得到";错误意外符号";。

然而,一些catogies的名称中也有空格。例如";Sum eiendeler";。也许";plyr";不喜欢那样吗?

不管怎样,这些都是次要的。

我看到的是这样的:

Regnscapår Regnskapår(-1år(。。直到(-9år(

Sum eiendeler Sum eiedeler(-1år(|R|R(-1åR(|R(-2åR||:----|:-------:|-----:|----|:----:|----:|:----|::----::|---:||2021 | 2020 | 2019 | 1234 | 1252 | 2034 | 14023 | 302 | AS|2021 | 2020 | 2019 | 9204 | 9222 | 9234 | 78088 | 3101 | AS|2021 | 2020 | 2019 | 1134 | 1782 | 2031 | 99054 | 3001 | KF|2021 | 2020 | 2019 | 5034 | 4782 | 4031 | 08884 | 5401 | ASA

我需要的是:

>021>td style="text align:right;">14023>td style="text-align:right;">14023>td style="text-align:right;">78088td style="text-align:left;">2021>td style="text-align:right;">78088SA>td style="text-align:right;">78088td style="text-align:left;">2020>td style="text align:right;">43378>
Year E Orgnr
2021 1234 14023AS
2021 12523021AS
2021 20343021AS
2021 9204310192223101
2021 9234310110345401KF

错误已修复:系统获取本地((给出";C";系统设置区域设置("LC_ALL","en_US.UTF-8"(修复它。

图书馆

rbind( ddply(df, . (columns that are identical for 10 years = colnames), 
ddply (df, . (columns that vary but I need merged = colnames), 
ddply (df, . (columns that vary but I need merged (-1 år) = column names), 
ddply (df, . (columns that vary but I need merged(-2 år) = column names))

相关内容

  • 没有找到相关文章

最新更新