我目前正在设计一个调查系统(调查有很多问题,一个问题有很多答案,belongs_to用户、调查、问题和答案的回答)。
我将在用户模型中拥有大量人口统计数据,并期望对各种问题等有 100 个数千个回复。
例如,最终我们将想要分析响应。 80%的男性喜欢香蕉,20%的女性拥有福特等等。
我正在研究像R,SAS和SPSS这样的统计语言,并且想知道我的数据是否需要以任何特定的方式结构化才能被这些程序使用?还是他们都接受 csv 文件?
在统计数据和为其构建数据模型方面,您有什么建议吗?
最后,SAS,SPSS和Stata的成本是多少?
CSV files
绰绰有余。 R
功能强大,可以管理按行和列排列的所有数据。
例如:您可以将 csv 的所有列排列为带有标题的变量/响应,您的行可以是数据,反之亦然。
只要它们按行和列排列就没关系。 Comma
,Space
CSV文件中的去限定列可以很容易地处理。并不是说我具体,你可以有任何delimiter
,R
有强大的regular expression
匹配。
唯一的建议是您应该为不同的数据集制作不同的CSV文件以使事情变得更容易,并且可以轻松地将其全部从CSV文件导入到data-frame
中。
一旦你完成了它,你就可以自由地释放R
的力量