执行大量数据库读取的单批作业

我有一个Spring Batch解决方案，它读取Oracle数据库中的几个表，对数据进行一些扁平化和清理，并将其发送到我们的BI平台Restful Api。Spring Batch按日期而不是按大小将这些数据分解为块。可能在某一天，一个区块可能由数百万行组成。我们以以下方式运行完整的端到端流程：

我的问题是：

如何在一组实例中分配此处理？并行处理可以实现吗？如果可以，我如何确保多个实例不会读取相同的行(以避免重复(？还有其他建议吗？

谢谢。

您可以使用(本地或远程(分区步骤，其中每个工作步骤都被分配了一个不同的数据集。您可以在这里的文档中找到更多详细信息和代码示例：

https://docs.spring.io/spring-batch/docs/current/reference/html/spring-batch-integration.html#remote-分区
https://github.com/spring-projects/spring-batch/tree/main/spring-batch-samples#partitioning-样品

相关内容