如何分割逗号分隔的文本文件不是为一行,而是为几行文件?



我对nifi完全陌生,我正在学习SplitText处理器。

是这样的。我有一个逗号分隔的txt文件,像这样:

KeyWord, SomeInformation   <---1st line is schema.
KeyWord1, "information"
KeyWord2, "information"
KeyWord1, "another information"
KeyWord2, "another information"

and so on.

那么问题是我如何根据关键字将这个文件分割成几个文件?所以每一行与KeyWord1对应到一个文件,每一行与KeyWord2对应到另一个文件,等等?

使用PartitionRecord并添加一个值为/KeyWord的用户定义属性keyword(名称是任意的,但将是添加到每个outgoing FlowFile的属性名称)。它将创建FlowFiles,其中一个包含Keyword字段为KeyWord1的所有行,另一个包含KeyWord2,依此类推。