正确地从PDF中提取图像



我有一个PDF文件,其中包含成功显示该图像的图像。当我尝试使用itextsharp或pdfsharp库从PDF文件中提取图像时,我得到字节,然后成功解码它们(因为那里有/Filter/FlateDecode)。但是当我尝试使用不同的库将这些字节转换为图像时,发生了异常(看起来字节实际上不是图像)。据我所知,问题是处理这些字节,但Pdf中的图像没有损坏,因为它正确地显示在那里。PDF在这里。

这些图像很可能以PDF格式存储,该格式在PDF规范中有文档记录。

将它们转换为Windows BMP格式相当简单。但是您仍然必须转换它们并添加带有来自PDF文件的图像属性的特定信息的标题。
在PDF中,新的图像行是字节对齐的,在Windows BMP中,它是dword对齐的。
如果有颜色表,不要忘记提取。

相关内容

  • 没有找到相关文章