如何将文档(Word, Powerpoint, Excel或其他PDF)保存为PDF，同时删除任何宏?

我有一个上传功能，允许我将文件上传到文件服务器。出于安全原因，我想剥离原始文件的内容，并创建一个不使用宏的新文件。例如，如果上传了一个PDF文件，我只想提取其内容并将其重新构建为一个新的PDF文件。我该如何在Python中做这些呢?

我正在考虑使用无头libreoffice将文件转换为PDF。但我很好奇这是否会将任何宏从原始文件复制到新重建的文件?

我认为你可以在python中使用fpdf模块。

from fpdf import FPDF

# save FPDF() class into
# a variable pdf
pdf = FPDF()  

# Add a page
pdf.add_page()

# set style and size of font
# that you want in the pdf
pdf.set_font("Arial", size = 15)

# open the text file in read mode
f = open("myfile.txt", "r")

# insert the texts in pdf
for x in f:
pdf.cell(200, 10, txt = x, ln = 1, align = 'C')

# save the pdf with name .pdf
pdf.output("mygfg.pdf")

但是我不知道它是否可以用word或excel。但是对于TXT文件，它可以工作。您必须在命令行上安装它。只需输入

pip install fpdf

相关内容

最新更新

热门标签：