如何将PDF元数据保存到AzureBlob



如何保存原始pdf的元数据,将文件上传到blob

我使用openOutputStream将文件保存到blob,并且在阅读时,我使用tika解析了内容,这使我在返回中为文件的元数据提供了

的元数据
Inputstream is = newBlobReference.openInputStream();    
BodyContentHandler handler = new BodyContentHandler(-1);
            Metadata metaData = new Metadata();
            ParseContext context = new ParseContext();
            PDFParser parser = new PDFParser();
            String content = "";
            parser.parse(is, handler, metaData, context);

只是要获得PDF的几个元数据(创建日期/XMPTPG:npages(,我必须使用tika解析该文件。上传PDF

时,有没有办法将元数据保存到斑点

不幸的是,在Azure Blob存储的上传过程中不可能获取数据。当在Azure Blob存储中建立/创建斑点时,可以设置和检索元数据,可以在此 documentation 上找到更多信息,还有其他替代方案,例如Azure Indexer,也需要需要斑点居住在存储中。我的建议是使用您使用的方法,然后将这些信息添加到可以保留该元数据的单独斑点中。

最新更新