我试图将flink的CEP用于日志文件(作为批处理作业(,而不是流(作为实时(。那可能吗 ?如果是,您知道Scala代码的示例吗?
flink的dataStream API和关联的库(包括CEP库(可用于有限的,历史的(批次(数据集或无绑定的实时流中,这没有区别。只需将文件(或目录(设置为数据源,然后正常使用CEP即可。为了获得正确的可重现结果,您应该在事件时间内工作(假设时间在处理中起作用(。这很重要,因为CEP希望根据事件时间对您的输入流进行分类 - 和之后的概念应与发生事件的何时相关,而不是当它们被处理时。
一些谷歌搜索将导致您进行一些CEP示例。在Flink训练(GitHub(中有一个简单的例子(在Java和Scala中(。