我所拥有的是一种宽格式,需要以不同的方式重新整形和排序。我每年总共有10列,所有行都是同一年,每列的年份不同。我想把这些合并成一列,只表示年份。然而,其他连续列也按年份划分。例如,预算|预算(-1年(|预算(-2年(等,适用于19个不同类别。然后是ID列和类别列。
所以到目前为止,我已经尝试了plyr、整形和熔融替代品。真的不管用。除此之外,我认为还有一些UTF-8问题。
我已经很久没有尝试在R-studio中使用UTF-8字符了,但我不记得遇到过和现在一样的问题。我不断地得到";错误意外符号";。
然而,一些catogies的名称中也有空格。例如";Sum eiendeler";。也许";plyr";不喜欢那样吗?
不管怎样,这些都是次要的。
我看到的是这样的:
Regnscapår Regnskapår(-1år(。。直到(-9år(
Sum eiendeler Sum eiedeler(-1år(|R|R(-1åR(|R(-2åR||:----|:-------:|-----:|----|:----:|----:|:----|::----::|---:||2021 | 2020 | 2019 | 1234 | 1252 | 2034 | 14023 | 302 | AS|2021 | 2020 | 2019 | 9204 | 9222 | 9234 | 78088 | 3101 | AS|2021 | 2020 | 2019 | 1134 | 1782 | 2031 | 99054 | 3001 | KF|2021 | 2020 | 2019 | 5034 | 4782 | 4031 | 08884 | 5401 | ASA
我需要的是:
Year | E | Orgnr | >|||
---|---|---|---|---|---|
2021 | 1234 | 14023 | 021AS | ||
2021 | 1252 | >td style="text align:right;">140233021 | AS | ||
2021 | 2034 | >td style="text-align:right;">140233021 | AS | ||
2021 | 9204 | >td style="text-align:right;">780883101 | td style="text-align:left;">20219222 | >td style="text-align:right;">780883101 | SA|
2021 | 9234 | >td style="text-align:right;">780883101 | td style="text-align:left;">20201034 | >td style="text align:right;">433785401 | >KF |
错误已修复:系统获取本地((给出";C";系统设置区域设置("LC_ALL","en_US.UTF-8"(修复它。
图书馆
rbind( ddply(df, . (columns that are identical for 10 years = colnames),
ddply (df, . (columns that vary but I need merged = colnames),
ddply (df, . (columns that vary but I need merged (-1 år) = column names),
ddply (df, . (columns that vary but I need merged(-2 år) = column names))