用于在多个页面中保存多个.doc文件的脚本



我有 150 个.doc(Microsoft Word(文件,每个文件由 6 页组成。我想将每个文件保存到 3 个文件中,第一个是第 1-2 页,第二个是第 3-4 页,第三个是 5-6 页。最好的办法是循环此操作,因此使用一个脚本我可以处理所有 150 个文件。输出是 .doc 还是 PDF 并不重要。有没有办法做到这一点?曾经手动进行了类似的拆分操作,花费了几个小时,所以我想走捷径。

非常感谢米.

也许您可以使用python读取每个文档并将其保存为临时文件或流,然后重写文档文件。

例:

one_doc = open('1.docx', 'rb')
two_doc = open('2.docx', 'rb') 
three_doc = open('3.docx', 'rb')
lines_one = one_doc.readlines()
lines_two = two_doc.readlines()
lines_three = three_doc.readlines() 
file = open("C:myfile.doc","w")
file.writelines(lines_one)
file.writelines(lines_two)
file.writelines(lines_three)
file.close()

http://python-docx.readthedocs.io/en/latest/user/documents.html

为了记录,如果您需要切入某个特定页面,也许您可以计算行数并将其除以。

最新更新