对于Flink来说,我正在构建一个简单的聚合管道,例如每天的销售额。我正在使用表api。我看到创建表有两种选择:临时表和永久表。对于永久表,我们还需要设置一个目录,例如HIVE。所以我倾向于使用临时表,它很容易上手。而是好奇对方的优点和缺点。
根据文档,当Flink作业停止时,临时表将不存在。那么,如果我们为bug修复做一个Flink Job部署会发生什么呢?
谢谢!
表不存储数据,而是存储元数据,即表的名称和位置。例如,在Kafka支持的表的情况下,代理的地址和主题名称。
可以使用临时表。但是,如果您想与其他应用程序共享此元数据,那么将其存储在目录中并使用永久表是很方便的。