如何使用Python将DOCX文件转换为.chm



我想使用Python将DOCX文件的内容(文本,图像,链接)转换为.chm文件。任何人都可以建议如何做。

我尝试使用docx2txt读取DOCX文件内容 https://github.com/ankushshah89/python-docx2txt软件包。但是我不确定如何读取文件中的图像和链接。有人可以建议如何分别读取每个内容并将其转换为.chm文件。

您也许警告一下这有一个学习曲线。

您需要将Word文档中的所有部分提取到包括图形文件的清洁HTML文件中。

请尝试将单词保存为HTML。但是我认为这不会使HTML干净。

您需要Microsoft HTMLHELP编译器来创建CHM文件。我建议将转换器工具或帮助创作工具(HAT)用于您的任务。

Google搜索此类工具" Doctochm",并尝试您的需求。

我最近需要将一些简历转换为纯文本。有很多用例,用于从二进制格式中提取可读文本。

您可以看到url'http://davidmburke.com/2014/02/02/04/python-convert-documents-doc-doc-docx-docx-docx-docx-pdf-to-plain-plain-text-without-libreoffice/p>

最新更新