从 CSV 导入记录并同时写入同一 CSV



我需要能够将CSV中每一行的两列与我自己的数据库进行比较。

例如,一行如下所示:

Headers => "Zipcode", "HouseNumber"
Row 1   => "5435 ZX", "43"
首先,我需要

根据邮政编码和门牌号在自己的数据库中查找一家公司,如果返回 true,那么我需要导入此行中的其余列。我知道如何解决这个问题。

但是,我还需要能够跟踪导入的行,因为我需要将总记录分成小块,因此我需要在导入后向每一行添加一个额外的字段。

总结一下:

在以下循环中导入后,如何向每一行添加一个额外的字段("导入"(:

CSV.foreach('reviews.csv', :headers => true) do |row|
   Review.create(row.to_hash)
end

如果您能找到Company,此代码片段将创建Review。您必须清理它以将其与companies表的正确属性名称匹配。

CSV.foreach('reviews.csv', :headers => true) do |row|
   Review.create(row.to_hash) if Company.where("Zipcode = ? and HouseNumber = ?", 
       row.Zipcode, row.HouseNumber)
end

若要向以下内容添加其他列:

CSV.foreach('reviews.csv', :headers => true) do |row|
   if company = Company.where("Zipcode = ? and HouseNumber = ?", 
       row.Zipcode, row.HouseNumber)
   row[:imported] = true
   Review.create(row.to_hash) 
end

这假定表中存在imported列。

我认为我们可能需要更多信息来给你一个更完整的答案,但这里的想法应该让你接近。

似乎最简单的做法是在单独的哈希中维护"导入"状态,如下所示:

imported = {}
CSV.read('reviews.csv').each_with_index do |row, line|
  if <your condition> && !imported[line]
    # create model
    imported[line] = true
  end
end
然后

保留该哈希值,直到您需要读取下一个块,然后重新运行。 && !imported[line]位将阻止读取一行两次。

如果这不是您要找的,则需要稍微澄清一下您的问题。 :-)

最新更新