我有一个上传功能,允许我将文件上传到文件服务器。出于安全原因,我想剥离原始文件的内容,并创建一个不使用宏的新文件。例如,如果上传了一个PDF文件,我只想提取其内容并将其重新构建为一个新的PDF文件。我该如何在Python中做这些呢?
我正在考虑使用无头libreoffice将文件转换为PDF。但我很好奇这是否会将任何宏从原始文件复制到新重建的文件?
我认为你可以在python中使用fpdf模块。
from fpdf import FPDF
# save FPDF() class into
# a variable pdf
pdf = FPDF()
# Add a page
pdf.add_page()
# set style and size of font
# that you want in the pdf
pdf.set_font("Arial", size = 15)
# open the text file in read mode
f = open("myfile.txt", "r")
# insert the texts in pdf
for x in f:
pdf.cell(200, 10, txt = x, ln = 1, align = 'C')
# save the pdf with name .pdf
pdf.output("mygfg.pdf")
但是我不知道它是否可以用word或excel。但是对于TXT文件,它可以工作。您必须在命令行上安装它。只需输入
pip install fpdf