如何将 Kaggle 数据集添加到 elasticsearch 中?



我是 elasticsearch 的新手,我正在尝试构建一个电影搜索应用程序。为此,我计划从kaggle获取数据并添加到我在localhost:9200本地设置的弹性搜索中。我在本地主机链接中看到了这一点:

name    "bxiIZLL"
cluster_name    "elasticsearch"
cluster_uuid    "zc_JPmw4TQ2G5bvahEF6LQ"
version 
number  "5.6.14"
build_hash  "f310fe9"
build_date  "2018-12-05T21:20:16.416Z"
build_snapshot  false
lucene_version  "6.6.1"
tagline "You Know, for Search"enter code here

现在我需要将 Kaggle 数据添加到此服务器。我该怎么做? 我在某处看到了 curld -XPUT 命令。我不确定这如何与Kaggle一起工作。

后续问题 - 如果我想稍后发布我的应用程序,如何托管 elasticsearch?

为了将CSV文件上传到elasticsearch:

  1. 下载文件。
      使用
    1. logstash 为了使用文件输入读取文件
    2. 根据需要使用LogStash的CSV过滤器修改和转换数据
    3. 输出日志存储到 Elasticsearch

对于您的后续问题 - 如何托管 Elasticsearch - 您可以自己运行它,例如在 AWS EC2 中,也可以使用托管服务,如 Elastic cloud 或 AWS ES。 祝你好运

最新更新