如何将PDF元数据保存到AzureBlob

如何保存原始pdf的元数据，将文件上传到blob

我使用openOutputStream将文件保存到blob，并且在阅读时，我使用tika解析了内容，这使我在返回中为文件的元数据提供了

的元数据

Inputstream is = newBlobReference.openInputStream();    
BodyContentHandler handler = new BodyContentHandler(-1);
            Metadata metaData = new Metadata();
            ParseContext context = new ParseContext();
            PDFParser parser = new PDFParser();
            String content = "";
            parser.parse(is, handler, metaData, context);

只是要获得PDF的几个元数据(创建日期/XMPTPG：npages(，我必须使用tika解析该文件。上传PDF

时，有没有办法将元数据保存到斑点

不幸的是，在Azure Blob存储的上传过程中不可能获取数据。当在Azure Blob存储中建立/创建斑点时，可以设置和检索元数据，可以在此 documentation 上找到更多信息，还有其他替代方案，例如Azure Indexer，也需要需要斑点居住在存储中。我的建议是使用您使用的方法，然后将这些信息添加到可以保留该元数据的单独斑点中。

相关内容

最新更新

热门标签：