我对nifi完全陌生,我正在学习SplitText处理器。
是这样的。我有一个逗号分隔的txt文件,像这样:
KeyWord, SomeInformation <---1st line is schema.
KeyWord1, "information"
KeyWord2, "information"
KeyWord1, "another information"
KeyWord2, "another information"
and so on.
那么问题是我如何根据关键字将这个文件分割成几个文件?所以每一行与KeyWord1对应到一个文件,每一行与KeyWord2对应到另一个文件,等等?
使用PartitionRecord并添加一个值为/KeyWord
的用户定义属性keyword
(名称是任意的,但将是添加到每个outgoing FlowFile的属性名称)。它将创建FlowFiles,其中一个包含Keyword
字段为KeyWord1
的所有行,另一个包含KeyWord2
,依此类推。