正确地从PDF中提取图像

我有一个PDF文件，其中包含成功显示该图像的图像。当我尝试使用itextsharp或pdfsharp库从PDF文件中提取图像时，我得到字节，然后成功解码它们(因为那里有/Filter/FlateDecode)。但是当我尝试使用不同的库将这些字节转换为图像时，发生了异常(看起来字节实际上不是图像)。据我所知，问题是处理这些字节，但Pdf中的图像没有损坏，因为它正确地显示在那里。PDF在这里。

这些图像很可能以PDF格式存储，该格式在PDF规范中有文档记录。

将它们转换为Windows BMP格式相当简单。但是您仍然必须转换它们并添加带有来自PDF文件的图像属性的特定信息的标题。
在PDF中，新的图像行是字节对齐的，在Windows BMP中，它是dword对齐的。
如果有颜色表，不要忘记提取。

相关内容

最新更新

热门标签：