如果PDF文件是第一代文档,我们如何在uipath中进行检查



UIPath中是否有某种方法或活动可以检查PDF文件是否为第一代文档?如果有任何想法或帮助,我们将不胜感激。非常感谢。

这更像是一个破解,而不是一个正确的解决方案,但它应该有效:将IntelligentOCR包中的数字化活动与您知道会返回单词机密性的OCR一起使用(我认为Microsoft OCR会这样做,但要仔细检查(。数字化活动将决定它是否需要OCR,如果没有使用OCR(意味着它是本地文档或第一代文档(,则DOM中的所有OCRConfidents都将为-1。

这样做有两个注意事项:

  • 如果数字化器决定文档文本不可读(例如,由于超级奇怪的自定义字体(,那么它可能会决定在本地PDF上使用OCR,在某些奇怪的边缘情况下也是如此
  • 虽然目前不支持数字化活动,但在未来的某个时候,数字化活动可能会进行部分OCR,例如,当原生PDF包含带文本的图像时。与任何";未记录特征";,小心使用,因为将来升级到新版本时,它可能随时损坏

相关内容

  • 没有找到相关文章

最新更新