情况是这样的。
我有两个数据源,一个消息队列和一个 MySQL 表,可以分别视为 DataStream 和 DataSet。我想启动一个基于 DataStream 的作业,从消息队列中提取数据并执行一些计算。在计算过程中,需要一个基于 DataSet(MySQL 表(的作业,其 OutputFormat 应将结果返回给 DataStream 作业。
我被困在这里,需要一些帮助。
不能在同一作业中混合使用数据流和数据集 API。但是有一些方法可以从流式处理作业访问MySQL。您可以:
- 从平面图查询 MySQL
- 使用异步 I/O 更有效地执行此操作
- 使用类似Debezium的东西从MySQL流式传输数据
根据您希望如何将数据从 mysql 连接到其他流,您可能需要使用 CoFlatmapFunction 或 CoProcessFunction。