提取Csv.gz文件,然后将其导入Excel/SSPSS..识别文本限定符有问题



我的论文使用的是Insideairbnb.com中的一个文件。它是一个csv.gz文件,所以首先我使用Mac的"归档实用程序"提取了它。

它是逗号分隔的,并使用双引号作为我在导入弹出窗口中指定的文本限定符,但Excel/SSPSS仍在文本中的逗号处进行分隔。

这是一个大文件,包括完整的airbnb描述和评论,包含在双引号中。不幸的是,文本字符串中有许多逗号。我从未见过这种格式的csv文件,但我相信它被正确地组合在一起,因为我在相当多的学术文章中看到过Insideairbnb被引用作为数据。

我在SPSS导入窗口中包含了一个数据片段图片的链接。如果有人知道如何导入这个,我将非常感谢您的反馈:(

提前谢谢!

[[1]:https://i.stack.imgur.com/Iy3dA.png][1] 【SPSS截图】[1] :https://i.stack.imgur.com/i7KcG.png[SSPSS截图2][1]

我同意@sarawhite上面的评论;如果这是一个一次性的问题,我会尝试几件事。

  1. 在excel中打开.csv,如果它看起来正确,请保存它,然后尝试在SPSS中导入,或者保存为.xlsx文件并导入(尽管其中的字符串变量可能是无意义的场景(

  1. 在记事本++中打开并查看原始数据。你可以找到并替换双线很容易断

我昨天将数据复制粘贴到Notepad++中,然后将其转换为ANSI并复制粘贴回Excel。昨天,它起了作用,但今天没有。。。

无论如何,也许这条线索对有同样问题的人有帮助。我稍后会再试一次。

最新更新