如何与Postgres设置风暴爬虫



我试图以Postgres SQL数据库作为后端来设置Stormcrawler。但是,没有关于需要哪些表格才能开始风暴爬行者的文档。

我需要哪些表以及它们有哪些列?还是有某种方法可以自动创建所需的表?另外,如何在此模式下启动爬行者?因为我不能像示例爬行拓扑那样发送种子网址。

请参阅tablecreationscript。对于注入URL,您可以用本教程中的插入物将其添加到桌子上,或者从Elasticsearch模块中重复使用注入拓扑,然后从MySQL模块中指定STATUSUPDATERBOLT。另一种方法可能是仅在SQLSPOUT并肩上添加MemorySpout。

最新更新