根据我所看到的,Google的Vision API允许您对PDF执行OCR,但它只返回JSON格式的检测到的文本。我需要的是一个可搜索(OCR(的PDF文件作为回报。这可能吗?
请注意,OutputConfig类型没有任何元数据字段来配置结果文件的格式。如您所知,API返回一个JSON响应。您可以首先使用API获取JSON数据,并探索使用以下任何存储库进行JSON到PDF转换,或者直接在源PDF上使用专门用于此目的的任何专用模块,如OCRmyPDF,并完全避免使用API。