iTextSharp透明图像提取



我正在使用iTextSharp,并试图从PDF中提取具有透明度的图像。当我提取图像时,透明度会变为纯黑色并丢失。我发现了多个图像提取的例子,但它们似乎都有相同的问题。我使用的代码低于

另一个例子来自itextpdf.com/examples/iia.php?id=284。此示例包括顶部"结果"部分中的图像。如果你点击Img7.png,你会看到图像中的黑色边框,但在页面底部有一个指向原始图像info.png的链接,它显示了它应该看起来的透明度。这正是我遇到的问题。如有任何帮助或想法,将不胜感激

public void ExtractImage(string pdfFile)
{
const int pageNumber = 1; //Page number to extract the image from
PdfReader pdf = new PdfReader(pdfFile);
PdfDictionary pg = pdf.GetPageN(pageNumber);
PdfDictionary res = (PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));
PdfDictionary xobj = (PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));
foreach (PdfName name in xobj.Keys)
{
PdfObject obj = xobj.Get(name);
if (obj.IsIndirect())
{
PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);
string width = tg.Get(PdfName.WIDTH).ToString();
string height = tg.Get(PdfName.HEIGHT).ToString();
ImageRenderInfo imgRI =
ImageRenderInfo.CreateForXObject(new Matrix(float.Parse(width), float.Parse(height)),
(PRIndirectReference)obj, tg);
var fileType= imgRI.GetImage().GetFileType();
RenderImage(imgRI, imgPath + +imgRI.GetRef().Number + "_" + imgRI.GetRef().Generation + "test." + fileType);
}
}
pdf.Close();
}
private void RenderImage(ImageRenderInfo renderInfo, string saveImageLocation)
{
PdfImageObject image = renderInfo.GetImage();
using (var dotnetImg = image.GetDrawingImage())
{
if (dotnetImg != null)
{
dotnetImg.Save(saveImageLocation);
}
}
}

请阅读PDF规范(ISO-32000-1)。您假设,例如,透明PNG,可以作为透明PNG存储在PDF中。这种假设是错误的。

PDF中不支持图像类型PNG。将透明PNG添加到PDF文档时,它会转换为两个压缩位图。一个位图是您所指的图像:据称失去透明度的图像。另一个位图,一个你没有告诉我们的图像,但在那里,是这个图像的掩码。当您检查ImageXObject时,您会注意到它有一个对此掩码的引用。这在我的书第10.3.2节中有解释,题为"蒙面图像"。

您声称您的PDF文档中存储了透明图像,这是错误的。相反,您有两个不透明的图像,其中一个图像是另一个图像的遮罩,以实现透明度。无法将这些图像提取为单个透明图像。您需要提取两个不透明图像,并将它们合并为一个透明图像。这超出了iText(夏普)的范围。

最新更新