小贝子编程

带有Pdf/a文件的Chalanges，用于使用Python进行提取

本文关键字：Python 提取用于 Pdf 文件 Chalanges 带有 python text-extraction pypdf pdfa
更新时间 : 2023-09-21
英文 : Challanges with Pdf/a file for extraction using Python

我们有一些PDF/A文件要提取，当我们尝试使用标准的PDF提取库时，整个页面的程序不会返回任何内容。对于标准pdf和重新调整值，同样的程序运行得非常好。

有人能帮助如何使用python库转换它们吗。

您尝试过pyPDF2吗？

import PyPDF2 
pdfFileObj = open('example.pdf', 'rb')

最新更新

TypeError: getiitems [props. properties].(动作)不是函数
通过脚本(Bash)执行时未加载模块
如何在Python/pandas中绑定(concat) 3个数据帧
Common LISP中多维数组的洗牌
javascript拖放，而不是显示图像信息
如何删除字母之间额外的空白字符?
在行为列表的数据框中过滤行
使用无服务器基础设施从套接字捕获数据
在react js中将json渲染为表
如何在gitlab ci中定义动态分支
如何制作一个记录事件的discord.py bot ?
Laravel对重复数据的集合求和
如何将具有相同类的多个元素更改为数组项列表
我将一个字符串转换为float，如何验证它是f64
如果pandas数据框架的一个单元格包含所有大写字符串的列表，则从该数据框架中删除一行
如何按开始时间和结束时间对日期数组进行分组，并减去最后一个值-第一个值
在页面中间改变滚动方向，然后返回
JavaScript如何for循环不同的元素作为一个变量在相同的函数中应用
Android Jetpack撰写和导航
payfort "response_message"："带有标记化的无效命令
如何检查我的"npx 安全帽编译"是否正常工作
OSError: -6在Micropython中进行简单的API调用时
带有AND操作符的For循环数组
无法从VPC内访问S3桶上托管的静态网站
使用Numpy Array在每个像素时间序列的特定位置插入值
如何在minikube上部署elasticsearch
如何在点击页面导航链接时停止屏幕滚动，React-Bootstrap和Gatsby
无法在本地种类群集中装载本地主机路径
不能将带有多个对象的文件从React上载到.net Core 5
在Python中找到蛋糕的最大块数

带有Pdf/a文件的Chalanges，用于使用Python进行提取

相关内容

最新更新

热门标签：