如何读取压缩CSV文件的特定列



我使用下面的代码读取压缩CSV文件的内容。

Zip::ZipFile.foreach(file) do |entry|
  istream = entry.get_input_stream
  data = istream.read
  #...
end

它给了我文本(CSV)文件的全部内容,标题如下:

NAME AGE GENDER NAME1 29 MALE NAME2 30 FEMALE

但我需要该列的具体数据。例如,我只想显示名称(NAME)。请帮我继续做这件事。

虽然您的示例显示了ZipFile,但您实际上是在问CSV问题。首先,您应该检查文档http://www.ruby-doc.org/stdlib-2.0/libdoc/csv/rdoc/CSV.html

您会发现,如果使用:headers=>true选项解析数据,则会得到一个CSV::table对象,该对象知道如何提取一列数据,如下所示。(出于明显的原因,我不会用这种方式编码——这只是一个例子。)

require 'zip'
require 'csv'
csv_table = nil
Zip::ZipFile.foreach("x.csv.zip") do |entry|
  istream = entry.get_input_stream
  data = istream.read
  csv_table = CSV.parse(data, :col_sep => " ", :headers => true)
end

对于您提供的数据,我们需要`col_sep=>",因为您使用空格作为列分隔符。但现在我们可以做到:

>> csv_table["NAME"]   # extract the NAME column
=> ["NAME1", "NAME2"]

首先,您可以将其用于参考:

http://www.ruby-doc.org/stdlib-2.0/libdoc/csv/rdoc/CSV.html

如果你有一个字符串,你可以做

array = CSV.parse("data")

这将为您提供一个数组数组,每行一个。现在,如果你知道每行的第一列是名称,你就可以操作该数组,即

array.map { |line| line[0] }.join(",") # returns NAME,<name>,<name>,<name> ...

相关内容

  • 没有找到相关文章

最新更新