小贝子编程

如何在python 3中从pdf中读取泰卢固语表项

本文关键字：读取卢固语 pdf python 中从 python tabula
更新时间 : 2023-09-17
英文 : How to read Telugu table items from pdf in python 3

我使用以下源代码从pdf获取英文表数据。但我无法获取其他语言。谁能帮助我如何传递语言参数并获取任何类型的语言

from tabula import read_pdf
url = "/Users/administrator/Desktop/Telugu_land_document1.pdf"
try:
df = read_pdf(url, pages='all')
print(df)
except Exception as e:
print(e)

您可以配置坐标信息，使其与语言无关。

df = tabula.read_pdf_with_template("/path/xxx.pdf", "path/temp.json")

# cat path/temp.json

[
{
"page":1,
"extraction_method":"a",
"x1":157.18,
"x2":1111.41,
"y1":270.97,
"y2":283,
"width":954.23,
"height":11.189
},
{
"page":1,
"extraction_method":"a",
"x1":157.18,
"x2":1111.41,
"y1":270.97,
"y2":283,
"width":954.23,
"height":11.189
}
...
]

最新更新

我无法显示我的所有收藏视图项目 .NET MAUI 应用程序
Programmatic NavigationLink推进去，没有动画
Angular and RxJS API calls
如何在不使用矢量的情况下调整指针的动态数组的大小?
在Hugo中将类似书籍的帖子拆分为多个页面
Django：如何创建"Published"和"Last edited"字段？
Textarea Label in Form: Error: Label元素的for属性的值必须是一个非隐藏表单控件的I
如何在没有源文件的情况下使用XSL创建XML
通过指针在实例上实现类型的调用函数
在批处理脚本中替换而不是添加前缀
如果类没有初始化，c++编译器会生成一个defctor吗?
在我的代码中没有得到任何方程的答案，我的按钮进入我的字段
vsto Outlook插件在Outlook 2016和Office 365中的行为不同
npm install不会在我的React项目中安装任何node模块
用两次检查遍历两个列表
将图像转换为RGB格式的文本文件，格式为三逗号分隔
我正试图找到一种方法将TimeSpan变量转换为秒的整数量
FCM云消息传递验证令牌
C多重间接
显示数组中元素的倒计时。setInterval 不会导致延迟。最后一个元素立即显示
sveltekit:等待来自+服务器的数据.t加载函数
JQuery是:检查每次点击返回两个值
RxJS中具有共享结果的请求队列
Beautifulsoup如何添加一些东西到列，如果元素没有显示
在Jekyll blog中按2D位置(距离)搜索
Robocopy在复制过程中向文件名添加日期
c -间接递归的用例
如何将日期对象转换为格式(DD-MM-YYYY)
如何从没有使用python硒链接的网站下载文件?
用错误处理循环捕获用户输入的最佳方法

如何在python 3中从pdf中读取泰卢固语表项

相关内容

最新更新

热门标签：