我想使用 manifold 抓取一个 Amazon s3 存储桶,将爬网中继到 OpenSearchServer。我看到其他产品带有亚马逊S3连接器,我只是想知道是否有一个公开可用的ManifoldCF。
自 8 月 27 日以来,有一个 https://github.com/apache/manifoldcf/tree/trunk/connectors/amazons3
祝黑客愉快!
目前,歧管默认不提供 Amazon S3 连接器,默认提供可用连接器。
如何编写连接器
除了如何开始编写连接器之外,我建议您从 manifold svn 中签出源代码,并查看其他连接器是如何编写的。例如。通用连接器、文件系统连接器是如何编写连接器的完美示例。