我正在寻求帮助,找到在excel中格式化csv文件的正确方法,以便导入excel进行数据分析。我所有的数据都是数字,它形成了一个6列10行的表。我希望能够绘制我的数据,运行任何类型的测试(ANOVA、t-测试等(,通过删除列或其他任何方式重新格式化,进行回归等。我过去曾使用过r中的csv文件,但我遇到了某些函数无法正常工作的问题(例如,tapply无法正常工作(。下面是一个简化的例子。
Nb在森林中 | 沼泽中 | 城市中 |
---|---|---|
32 | 17 | 5|
28 | 15 | 7 |
35 | 17 | 5 |
20 | 12 | 4 |
19 | 14 | 3 |
26 | 10 | 8 |
每一行都应该是一个唯一的ID,比如收集数据的点、培养皿或群体。我会为每个样本添加一个具有唯一id的第一列。然后将列名中的所有空格都替换为_,因为R不喜欢空格,它会自动将它们替换为。但这以后会变得令人困惑。就我个人而言,我会使用nb_f,nb_s,nb_u。如果整个表格只是nb数据,那么就只有森林、沼泽、城市。R是区分大小写的,所以保持大小写一致。请确保单元格中没有隐藏的空格或制表符。只需为每一个都做一个查找替换即可。Notepad++是一个很好的文本阅读器,用于清除数据集中的隐藏字符。