如何使用Apache Tika解析HDF文件(.h5
(。
Apache Tika 为.h5
文件提供了解析器,但使用它我无法解析数据。
Parser parser=new HDFParser();
Metadata metadata=new Metadata();
ContentHandler handler=new BodyContentHandler();
FileInputStream fileInputStream=new FileInputStream(path+h5File);
parser.parse(fileInputStream,handler,metadata,new ParseContext());
我可以看到文件的元数据,但我无法使用handler
获取内容。
如果有人这样做了,请帮助我解决这个问题。
只是你不能因为HDF格式文件的性质。
您必须使用metadata.get(field-name-in-string-format);
来检索所需的信息。
或者,您可以直接尝试此Java库:NetCDF(Tika在引擎盖下使用它(