情况:
- 服务器不支持 exec/shell_exec(因此 pdftotext 被排除在外)
- 其他库不接受 PDF。Pdftotext工作(在本地文件上测试)
以下是 (PDF) 代码的一些摘录:
5 0 obj
>
stream
Gat$ugPXc?%"6H'p]ofd'_qs00UX27?3p0*8m>KOQL4]:u"*$$^'f*q*SGMee*e$5&=alj@GV7YPq9pg!Lr0>Y2n'&lmd4Br?V9N
P:_",WI.kJ#'cs>77M9eTkA;,t#f)aaGuNS-6=Wp*uBg,Ft9Tcj#aI]nD[C6&m@9m?m!p6=IBt=o_LGHh!q>f$C.jdOXbSP/796HV`_Y]Y
l)M(]FZ9Ld-J_mMRe2q(D>`V@G`NM]crn@_V?sGC@W9^bnrY$.mqeVN^YEcqK)blO~>
endstream
endobj
关于创作者:
%PDF-1.41 0 obj>恩多布吉
我想得到一些关于如何在不使用exec/shell_exec函数的情况下将其转换为PHP中的纯文本的建议。
谢谢。
(像 http://webcheatsheet.com/php/reading_clean_text_from_pdf.php 这样的其他解决方案不起作用,我无法让他们至少将此代码转换为看起来像 ASCII 代码的东西。
您不能只解析此流,因为您需要使用文件中的许多其他数据(如字体编码)对数据进行解码。你真的想使用一个库来做到这一点...