我在Cloudera生态系统中工作,作为一名初学者,我从实现flume twitter示例开始,并成功地完成了它。现在,每当我想从Twitter流式传输不同关键字的数据时,我都必须进入Twitter的配置文件并对其进行编辑,然后使用终端执行flume代理。
我在想一种方法,让用户打开一个表单,在其中输入关键字,然后执行flume代理从Twitter获取数据,而不是每次都去Twitter配置文件。为此,我想知道Cloudera生态系统中是否有任何工具可以实现我上面讨论过的想法?
Cloudera Manager是唯一允许Flume代理配置AFAIK的接口。
否则,您将不得不制作自己的UI来完成如此具体的任务。
如果可能的话,你可以通过一个名为Streamsets的Parcel安装一个单独的工具,这是一个更完整、可编程的流媒体工具,由Flume的一些人开发。