UIPath中是否有某种方法或活动可以检查PDF文件是否为第一代文档?如果有任何想法或帮助,我们将不胜感激。非常感谢。
这更像是一个破解,而不是一个正确的解决方案,但它应该有效:将IntelligentOCR包中的数字化活动与您知道会返回单词机密性的OCR一起使用(我认为Microsoft OCR会这样做,但要仔细检查(。数字化活动将决定它是否需要OCR,如果没有使用OCR(意味着它是本地文档或第一代文档(,则DOM中的所有OCRConfidents都将为-1。
这样做有两个注意事项:
- 如果数字化器决定文档文本不可读(例如,由于超级奇怪的自定义字体(,那么它可能会决定在本地PDF上使用OCR,在某些奇怪的边缘情况下也是如此
- 虽然目前不支持数字化活动,但在未来的某个时候,数字化活动可能会进行部分OCR,例如,当原生PDF包含带文本的图像时。与任何";未记录特征";,小心使用,因为将来升级到新版本时,它可能随时损坏