尝试使用Neo4j通过HDFS读取CSV文件时出错



我正试图通过Neo4j中的apoc库读取位于我的hdfs文件系统中的csv文件,并使用以下代码行">

CALL apoc.load.csv('hdfs://ipAddrress:port/myFileLocation.csv')

我还禁用了apoc的Neo4j配置,并启用了通过apoc导入文件。因此,我在配置文件中包含了以下行:

apoc.import.file.use_neo4j_config=false
apoc.import.file.enabled=true

但我一直得到以下错误:

Failed to invoke procedure `apoc.load.csv`: Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.fs.FSDataOutputStream

依赖项内置在neo4j apoc扩展中,但我不知道为什么找不到与hadoop相关的类。有什么帮助吗?

在互联网上搜索了一下后,我从Tom Geudens那里找到了这个。

此时这是不可能的:CSV文件可以存储在数据库服务器,然后可以使用文件访问:///URL。或者LOAD CSV也支持通过HTTPS访问CSV文件,HTTP和FTP。您可以通过http公开您的hdfs文件系统(然后使用http://url(,但在其他方面。。。编号

最新更新