我是 elasticsearch 的新手,我正在尝试构建一个电影搜索应用程序。为此,我计划从kaggle获取数据并添加到我在localhost:9200本地设置的弹性搜索中。我在本地主机链接中看到了这一点:
name "bxiIZLL"
cluster_name "elasticsearch"
cluster_uuid "zc_JPmw4TQ2G5bvahEF6LQ"
version
number "5.6.14"
build_hash "f310fe9"
build_date "2018-12-05T21:20:16.416Z"
build_snapshot false
lucene_version "6.6.1"
tagline "You Know, for Search"enter code here
现在我需要将 Kaggle 数据添加到此服务器。我该怎么做? 我在某处看到了 curld -XPUT 命令。我不确定这如何与Kaggle一起工作。
后续问题 - 如果我想稍后发布我的应用程序,如何托管 elasticsearch?
为了将CSV文件上传到elasticsearch:
- 下载文件。
- 使用
- logstash 为了使用文件输入读取文件
- 根据需要使用LogStash的CSV过滤器修改和转换数据
- 输出日志存储到 Elasticsearch
对于您的后续问题 - 如何托管 Elasticsearch - 您可以自己运行它,例如在 AWS EC2 中,也可以使用托管服务,如 Elastic cloud 或 AWS ES。 祝你好运