iTextSharp透明图像提取

我正在使用iTextSharp，并试图从PDF中提取具有透明度的图像。当我提取图像时，透明度会变为纯黑色并丢失。我发现了多个图像提取的例子，但它们似乎都有相同的问题。我使用的代码低于

另一个例子来自itextpdf.com/examples/iia.php？id=284。此示例包括顶部"结果"部分中的图像。如果你点击Img7.png，你会看到图像中的黑色边框，但在页面底部有一个指向原始图像info.png的链接，它显示了它应该看起来的透明度。这正是我遇到的问题。如有任何帮助或想法，将不胜感激

public void ExtractImage(string pdfFile)
{
const int pageNumber = 1; //Page number to extract the image from
PdfReader pdf = new PdfReader(pdfFile);
PdfDictionary pg = pdf.GetPageN(pageNumber);
PdfDictionary res = (PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));
PdfDictionary xobj = (PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));
foreach (PdfName name in xobj.Keys)
{
PdfObject obj = xobj.Get(name);
if (obj.IsIndirect())
{
PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);
string width = tg.Get(PdfName.WIDTH).ToString();
string height = tg.Get(PdfName.HEIGHT).ToString();
ImageRenderInfo imgRI =
ImageRenderInfo.CreateForXObject(new Matrix(float.Parse(width), float.Parse(height)),
(PRIndirectReference)obj, tg);
var fileType= imgRI.GetImage().GetFileType();
RenderImage(imgRI, imgPath + +imgRI.GetRef().Number + "_" + imgRI.GetRef().Generation + "test." + fileType);
}
}
pdf.Close();
}
private void RenderImage(ImageRenderInfo renderInfo, string saveImageLocation)
{
PdfImageObject image = renderInfo.GetImage();
using (var dotnetImg = image.GetDrawingImage())
{
if (dotnetImg != null)
{
dotnetImg.Save(saveImageLocation);
}
}
}

请阅读PDF规范(ISO-32000-1)。您假设，例如，透明PNG，可以作为透明PNG存储在PDF中。这种假设是错误的。

PDF中不支持图像类型PNG。将透明PNG添加到PDF文档时，它会转换为两个压缩位图。一个位图是您所指的图像：据称失去透明度的图像。另一个位图，一个你没有告诉我们的图像，但在那里，是这个图像的掩码。当您检查ImageXObject时，您会注意到它有一个对此掩码的引用。这在我的书第10.3.2节中有解释，题为"蒙面图像"。

您声称您的PDF文档中存储了透明图像，这是错误的。相反，您有两个不透明的图像，其中一个图像是另一个图像的遮罩，以实现透明度。无法将这些图像提取为单个透明图像。您需要提取两个不透明图像，并将它们合并为一个透明图像。这超出了iText(夏普)的范围。

相关内容

最新更新

热门标签：