如何使用PHP从PDF,docx,doc获取HTML代码



我想使用php将任何pdf,docx,doc文件转换为html代码,样式与pdf相同。我没有得到正确的解决方案。

Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');
// change pdfinfo bin location
Config::set('pdfinfo.bin', 'C:/poppler-0.37/bin/pdfinfo.exe');
// initiate
$pdf = new GufyPdfToHtmlPdf($item);
// convert to html and return it as [Dom Object](https://github.com/paquettg/php-html-parser)
$html = $pdf->html();

不为我工作。

我遇到了类似的问题,我找到了一个与word文档一起使用的github。当时效果相当不错,但我最近还没有测试过。 试试吧。

https://github.com/benbalter/Convert-Word-Documents-to-HTML

我认为这篇文章可以在第一次帮助你。有了这个,您将能够使用 PHP 将任何 pdf 转换为 HTML 代码。

在此之后,您可以使用本文提供的帮助使用 PHP 将.doc.docx转换为 PDF。

我认为您现在可以为每个要转换为 HTML 的文档扩展构建一个函数。

祝你好运。

我遇到了一个Web服务,它提供了一个用于转换文档的API。我还没有非常彻底地测试它,但它似乎在将 Word 转换为 HTML 时产生了不错的结果:

https://cloudconvert.org/

相关内容

  • 没有找到相关文章