我已经使用google AutoML实体提取器创建了一个自定义处理器,并训练了一些pdf。Pdf实际上包含照片身份证。我能够在他们的UI中测试它,它能够正确地提取实体。现在我正在使用他们的Java客户端库,使用下面给出的代码来完成这项工作。这是的样本
https://github.com/googleapis/java-automl/blob/b4c760c01efbd2174d93af85c5fbab3c09eee9f2/samples/snippets/src/main/java/com/example/automl/LanguageEntityExtractionPredict.java
在这里,我看到他们将文本内容传递到库中,而我想发送PDF内容。我不想使用谷歌云存储桶,而是想在本地加载文件并将其发送到实体提取器。我尝试使用下面的中的Document
类
Document.parseDelimitedFrom(FileInputStream("test.pdf"))
,但它给了我一个错误。
任何帮助都会得到高度评价。
Document.parseDelimitedFrom(FileInputStream("test.pdf"))
抛出错误,因为parseDelimitedFrom()
方法需要protobuf消息进行解析,而不是本地PDF文件的InputStream。话虽如此,但目前还没有提供发送本地文件进行预测,如本RESTneneneba API文档所示。DocumentInputConfig
参数仅支持GCS震源。
功能请求
我在谷歌的问题追踪中提出了这一要求作为一项功能要求此问题可在此处找到-问题编号218865096。您可以STAR
该问题以接收自动更新,并通过参考此链接为其提供吸引力。此外,请注意,功能请求没有时间表,也没有实现保证。有关此功能请求的所有通信都将在Issue Tracker上完成。