Tika服务器在处理pdf文件时返回500状态码



代码:

dd= parser.from_file(r"file_path")

.py中的第554行

resp = verbFn(serviceUrl, encodedData, **effectiveRequestOptions)

原因为INKApi错误。

我在我的系统上运行tika server .

首先,您可以使用docker映像启动并运行tika-server:

docker run -d -p 9998:9998 apache/tika:1.28.2-full 

一旦你让图像运行,你能试着像这样打开文件吗?

from tika import parser
os.environ['TIKA_SERVER_ENDPOINT'] = 'http://0.0.0.0:9998/'
with open('path/to/file', 'rb') as file:
data = parser.from_file(file)

相关内容

  • 没有找到相关文章

最新更新