我正在处理数据库突变流,即更改日志流。我希望能够使用SQL查询来转换值。我很难将以下三个概念汇总在一起 RowTypeInfo
,Row
和DataStream
。
注意:我不知道该架构。我使用Mutation
对象中的数据(Mutation
是自定义类型(构建它
更具体地说,我有看起来像这样的代码。
val execEnv = StreamExecutionEnvironment.getExecutionEnvironment
val tableEnv: StreamTableEnvironment = TableEnvironment.getTableEnvironment(execEnv)
// Mutation is a custom type
val mutationStream: DataStream[Mutation] = ...
// toRows returns an object of type org.apache.flink.types.Row
val rowStream:DataStream[Row] = mutationStream.flatMap({mutation => toRows(mutation)})
tableEnv.registerDataStream("spinal_tap_table", rowStream)
tableEnv.sql("select col1 + 2")
注意:Row
对象是位置,并且没有列名称的占位符。我找不到将架构连接到DataStream
对象的地方。
我想传递某种类似于Row
的结构,该结构包含查询的完整信息{columnName: String, columnValue: Object, columnType: TypeInformation[_]}
。
在Flink SQL中,当Table
定义时,表格架构是必不可少的。不可能在动态键入记录上运行查询。
关于RowTypeInfo
,Row
和DataStream
的概念:
-
Row
是保存数据的实际记录 -
RowTypeInfo
是Row
s的架构描述。它包含Row
的每个字段的名称和TypeInformation
。 -
DataStream
是逻辑记录流。DataStream[Row]
是一排。请注意,这不是实际流,而只是代表API中的流的API概念。