r-导入DAT文件-分析问题

我有一个以制表符分隔的DAT文件，我想将其读取到R中。当我使用read.delim导入数据时，我的数据帧具有正确的列数，但行数超出了预期。

我的数据文件代表对调查的回复。再深入一点，当一列中有一个"."表示开放式回答时，R似乎正在创造一个新的记录。有时，受访者可能会点击"回车"来添加新行。

有办法绕过这个吗？我阅读了帮助，但我不确定如何告诉R忽略字符响应中的此字符。

下面是一个解析错误的响应示例。这是一个响应，但您可以看到，当R.解析时，会有一些返回将其放在多行上

possible ask for size before giving free tshirt.
 Also maybe have the interview in conference rooms instead of tight offices. I felt very cramped.
 I would of loved to have gone, but just had to make a choices and had more options then I expected.

我正在用SPSS分析数据，数据很好，但是，我需要使用R进行更高级的建模

任何帮助都将不胜感激。提前谢谢。

有一个'na.strings'参数。你不提供任何测试用例，但也许你可以这样做：

read.delim(file="myfil.DAT", na.strings=".")

我认为如果你能对你的问题进行编辑，更好地说明问题，那就太好了。我无法通过简单的努力创建错误：

> read.delim(text="atbt.nctdten",header=FALSE)
  V1 V2 V3
1  a  b  .
2  c  d  e
> read.delim(text="atbt.nctdten",header=FALSE, na.strings=".")
  V1 V2   V3
1  a  b <NA>
2  c  d    e

（澄清后，上述评论并不特别相关。）这将引入一个包含换行符的字段。。。。但它要求在原始文件中引用"字段"：

> scan(file=textConnection("'anb'nxt.nctdten"), what=list("","","") )
Read 2 records
[[1]]
[1] "anb" "c"   
[[2]]
[1] "x" "d"
[[3]]
[1] "." "e"

相关内容

最新更新

热门标签：