需要帮助将数据从pdfplumber导入.csv文件



我使用pdfplumber从pdfs中提取文本,但当我尝试使用to_csv导入数据时,抛出#me错误。需要帮助将数据导入.csv

import pdfplumber
import pandas as pd
import numpy as np
import os
import re
from collections import OrderedDict
pdf = pdfplumber.open('C:/Users/Desktop/Mydata.pdf')
page = pdf.pages[1-76]
text = page.extract_text()
text
print(text)

text2 = pd.DataFrame([text])
text2.to_csv("C:\Users\Desktop\MyPDFData\converted_text.csv")

没有在导入的文件中获取数据只是得到了一个空文件

您可能不需要panda。只需先打开CSV引擎:

with open(your_csv_file_name, mode='w', newline='') as export_csv:
csv_writer = csv.writer(export_csv, escapechar=' ', quoting=csv.QUOTE_NONE)
csv_writer.writerow(text)

有一个很好的页面来了解CSV导出:

https://realpython.com/python-csv/?fireglass_rsn=true

相关内容

  • 没有找到相关文章

最新更新