将 docx 表转换为 html(保留所有格式)或要在 html 中使用的图像



我已经使用python-docx在我的docx文件中使用指定的样式格式创建了一些表。我现在需要以相同的格式使用这些表。有没有办法转换表格,包括所有格式和样式、颜色等。 到网页?或者没有一种简单(自动化)的方法将表格制作成可以使用的图形?

要隐蔽 Docx 到 HTML,请使用以下代码:

下面的代码不标识 docx 中的表和图像。它将docx转换为html,但不保留表格和图像。

import mammoth
Docx = open("docx_file.docx", 'rb')
html = open('html_filename.html', 'wb')
document = mammoth.convert_to_html(Docx )
html.write(document.value.encode('utf8'))
Docx.close()
html.close()

要保持格式和图像,请使用 win32 包将 docx 转换为 html。

import win32com.client
doc = win32com.client.GetObject ("docx_InputFile.docx")
doc.SaveAs (FileName="Html_FileName.html", FileFormat=8)
doc.Close ()

我找不到合适的解决方案,支持格式和样式转换。但是您可以尝试使用以下方法将docx转换为jpg:DOCX到JPG API。此服务的 Python 库和片段如下: ConvertAPI/convertapi-python

最新更新