我试图在文档AI中给出一个提示,只在特定区域获取表。但它不起作用。
TableBoundHint tableBoundHints = TableBoundHint.newBuilder()
.setBoundingBox(BoundingPoly.newBuilder()
// top left
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(0).setX(0).build())
// top right
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(1).setX(0).build())
// bottom right
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(1).setX(0.25f).build())
// bottom left
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(0).setX(0.25f).build()).build())
.setPageNumber(1)
.build();
我做错了吗?还是因为它处于测试阶段,所以不起作用?
根据您的代码片段,您只设置了;x〃;归一化顶点坐标的坐标;然而;x、 y";坐标来指定多边形。作为参考,您可以查看Node.js示例和Python示例。
在检查Java的客户端库时;y";坐标
public Builder setY(float value) {
y_ = value;
onChanged();
return this;
}
基于此,代码应该看起来像:
TableBoundHint tableBoundHints = TableBoundHint.newBuilder()
.setBoundingBox(BoundingPoly.newBuilder()
// top left
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(0).setY(0).build())
// top right
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(1).setY(0).build())
// bottom right
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(1).setY(0.25f).build())
// bottom left
.addNormalizedVertices(NormalizedVertex.newBuilder().setX(0).setY(0.25f).build()).build())
.setPageNumber(1)
.build();
另一方面,文档AI API基于机器学习模型和方法问题,在统计上无法保证结果完全准确,但它正在不断改进。
正如您所提到的,此功能处于测试阶段,可能会更改或支持有限。有关更多信息,请参阅产品发布阶段。
FYI,有一个针对Document AI[云文档AI]的主动监控标签
文档AI于2021年正式发布,v1
API发布。API的行为和输出在v1beta2
和当前GA版本v1
之间发生了显著变化。建议对今后的所有活动使用v1
API。
GA版本不再支持TableBoundHint
。
Form Parser用于将表单字段识别为文档中的键值对和表。该文档最近进行了更新,以显示如何处理表单分析器的处理响应,从而识别文档中的表。
https://cloud.google.com/document-ai/docs/handle-response#forms_and_tables