Python不寻常的文本文件到数据库:策略



我对Python很陌生,所以我想问你一些关于正确策略的建议。我有一个文本文件,其中包含固定的数据位置,如下所示。它可以有超过 10000 行。最后,数据库 (SQL) 表应如下所示。文件和表格

重要的列是 nr。42. 它定义了此行中的数据类型。(2-> 标题,3->文本 6->金额和价格)。因此,数据来自不同的行。

问题:

  1. 读取数据:因为总是超过 4 行包含数据,逐行处理它们,只要一个 SQL语句完成,发送 OR:将所有行读成列表列表,然后遍历这些列表?或者:读取中的所有行一个列表并迭代?
  2. 将数据转换为 csv 或 json 而不是准备 sql 语句,然后使用数据库软件导入数据库会更好吗?(或使用NoSQL DB)

我希望我把我的问题说清楚,如果没有,我会尝试.....每一个建议都非常感谢。

这个问题很简单,所以也许你想多了。 我的建议是使用最简单的解决方案:读取一行,解析它,准备一个SQL语句并执行它。如果数据库大约有 10000 条记录,那么任何事情都可以工作,例如 SQLLite 就可以了。 问题已经以表的形式出现,因此转换为SQLLite或MySQL等关系数据库是一个非常明显和直接的选择。如果你的数据中需要不同类型的组织,那么你可以看看其他类型的数据库:不要仅仅因为它"时尚"而这样做。

最新更新