导出时避免重复数据?



我写了一个Python程序从SQL Server获取数据自动化。它每n个周期运行一次。问题是无论何时运行,它都会从表中获取所有数据。但是我想要获取最新的记录,这些记录是在之前运行python脚本后插入数据库的。

例如:数据库中有10条记录,python脚本运行并获取所有10条记录。然后5更多的记录被添加到数据库中,在Python脚本的第二次运行中,它应该只获取这5条记录?

还有一个条件是不修改向该表添加列。

如果您的表有一个Identity字段,实现您所描述的最简单的方法是使用一个单独的表来保存您在数据提取过程中检索到的数据的最新Id。

然后,您只需更改用于提取数据的过程,使其仅提取此单独表中保存的最新Id之后的行,并使用您刚刚提取的数据的最大Id更新它。

无论如何,这都不是最干净的方法,但它确实达到了您的要求,同时保持不改变现有表的条件。

相关内容

  • 没有找到相关文章

最新更新