在窗口中,文档文件以.docx结尾
为了将.docx文件的内容转换为HTML字符串,我使用了庞大的软件包,一切都很完美。
现在我面对的是Unix系统中.odt文件,它使用的是LibreOffice。
问题是:有没有像猛犸象这样的包.odt文件转换为 HTML?
如果别无选择,也许我必须从.odt文件转换为.docx文件,只是为了重用猛犸象。有没有任何 python 包可以做到这一点?
提前谢谢你!
您是否尝试过查看 https://pypi.org/project/odfpy/包?它似乎是操作 ODT 文件的一个非常方便的包装器。
更具体地说,在该包中似乎有一个函数/API,允许您将ODT文件转换为某种形式的HTML,因此请尝试查看它。
odf2xhtml - 在包链接上将 ODF 转换为 (X(HTML应该为您指明正确的方向。祝你好运!