CHM 或 HTML -> PDF,保留 HTML 链接?



我们有一个专有的在线图书/手册生成系统,可以从数据库中创建编译的帮助文件(CHM)以及HTML版本的内容。

这个系统运行得很好,我们已经使用这个系统好几年了,没有做过重大的修改。

现在,我们还想从相同的源生成pdf。我看过一些CHM-to-PDF和HTML-to-PDF转换器,但我还没能找到一个正确处理超链接的,尽管类似的问题在这里被问了很多次,似乎没有人找到一个好的解决方案(或者至少他们没有费心发布任何关于它的信息)。

有什么建议吗?在这个领域已经做了这么多的工作,我不愿意再写一个PDF生成器。

通常从抽象源生成所有这些。HTML作为一个标准是如此的广泛,创建一个通用的HTML来转换成非HTML的东西是非常非常困难的,输入可能是所有的东西。而且CHM似乎和MSIE一样支持HTML(读:很多)

因此,最聪明的做法可能是确定用于实现基本格式的HTML子集,并尝试从中生成一些东西。考虑尝试通过编辑(大量替换)和脚本来简化html,然后用最少的格式(和一些抽象形式)提取大部分内容

一般情况下html->的转换器是非常困难或不理想的(想想把渲染内容的图片放在PDF中),所以你总是在谈论子集。

我是一家将html转换为pdf的公司的部分所有者:医生。

下面是一个示例,我认为它演示了"正确"处理超链接。也就是说,外部链接被发送到默认的web浏览器,哈希链接跳转到PDF中"Test!"出现了。你可以在这里查看这个示例的PDF输出。

<html>
  <head>
    <style type="text/css">
      hr {page-break-after:always;}
    </style>
  <body>
    <a href="http://www.google.com">Google</a>
    <a href="#test">Test?</a>
    <hr />
    <h1 id="test">Test!</h1>
  </body>
</html>

这个示例中的hr样式只是为了让我可以有两页文本,以便链接可以演示功能

最新更新