使用tdloader (fuseki)加载N-quad (.nq)文件



我有一个.nq文件,我想把它加载到Fuseki三重存储中,但我得到以下错误:

Exception in thread "main" org.apache.jena.atlas.AtlasException: java.nio.charset.MalformedInputException: Input length = 1
at org.apache.jena.atlas.io.IO.exception(IO.java:206)
at org.apache.jena.atlas.io.CharStreamBuffered$SourceReader.fill(CharStr
eamBuffered.java:77)
at org.apache.jena.atlas.io.CharStreamBuffered.fillArray(CharStreamBuffe
red.java:154)
at org.apache.jena.atlas.io.CharStreamBuffered.advance(CharStreamBuffere
d.java:137)
at org.apache.jena.atlas.io.PeekReader.advanceAndSet(PeekReader.java:243
)
   at org.apache.jena.atlas.io.PeekReader.init(PeekReader.java:237)
   at org.apache.jena.atlas.io.PeekReader.peekChar(PeekReader.java:159)
   at org.apache.jena.atlas.io.PeekReader.makeUTF8(PeekReader.java:100)
   at org.apache.jena.riot.tokens.TokenizerFactory.makeTokenizerUTF8(Tokeni
zerFactory.java:41)
   at org.apache.jena.riot.RiotReader.createParser(RiotReader.java:131)
   at org.apache.jena.riot.RDFParserRegistry$ReaderRIOTFactoryImpl$1.read(R
DFParserRegistry.java:141)
   at org.apache.jena.riot.RDFDataMgr.process(RDFDataMgr.java:859)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:687)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:666)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:654)
   at com.hp.hpl.jena.tdb.store.bulkloader.BulkLoader.loadQuads$(BulkLoader
.java:149)....

是否可以加载。nq文件到fuseki?我使用以下命令:

tdbloader --loc=data articles.nq

Jena版本是apache-jena-2.11.2, fuseki版本是Jena -fuseki-1.0.2。

提前感谢!

可以加载N-Quads

问题是数据不是UTF-8。

articles.nq.gz显示为数据的gzip文件的gzip文件。两级的gzip文件。

运行一次gzip会留下一个二进制文件,而不是N-quads。

真实的数据是相当混乱的,但它的警告(据我所知)。

最新更新