Java - 将 doc/docx 文件转换为 chm 文件



我有一个将Word文档(.doc/.docx)文件转换为帮助文件(.chm)格式的想法。我想使用 Java 来转换文件。我的公式很简单。使目录页面和word文档中的其他链接,如包资源管理器或文件资源管理器,并使用户导航更简单,更快,更容易在文档中的页面之间导航。

所以,我的问题是:

java 中是否有任何可以导入并用于文件转换的本机库?

请分享您的想法,以实现上述概念。

在Java中完成这是一项非常困难的任务。但是,如果您安装了Microsoft HTML 帮助研讨会,您仍然可以这样做。

  1. 首先,您可以通过Apache POI提取Word文档的文本,然后将它们作为HTML文档输出到临时目录。
  2. 接下来,您需要创建一个 HHP 文件。它应该很容易创建,因为它是一个文本文件。只需遵循此处给出的规格
  3. 然后,您还应该有一个相应的HHC文件。它是以下格式的简单 HTML 文档:

    <html>
    <head>
    </head>
    <body>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Foo Directory">
    <param name="Local" value="BarDirectory/index.htm">
    <param name="ImageNumber" value="1">
    </object></li>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Bar.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Foo.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    </ul>
    </ul>
    </body>
    </html>
    

    同样,查找 HHK 文件的结构。

  4. 完成后,您可以从Java执行hhc.exe <inputfile.hhp>。这应该可以完成这项工作。

不是我知道的,也不是我能找到的。但是,相反,制作一个为你做所有事情的java程序,操纵你需要的软件,如果你手动做,你会使用呢?只需发送命令并让它为您完成即可。我会提供一些代码,但我还没有在 java 中这样做。

另一种方法是在VBscript中执行此操作,调用某些Java类来运行,并使用VBScript向程序发送击键。此方法的唯一缺点是您无法在后台运行它,并且在完成之前无法使用您的计算机。

最新更新