处理IText XMLWorker中的嵌入图像



处理IText XMLWorker中的嵌入图像。

有没有一种方法可以在XMLWorker中处理嵌入式(Base64)映像?在版本5.3.5中我使用的ImageProvider不再工作(之前引发了异常),所以我按如下方式修补了ImageRetrieve,但很明显,这将在下一步被打破XMLWorker更新:

package com.itextpdf.tool.xml.net;
import java.io.File;
import java.io.IOException;
import java.net.MalformedURLException;
import com.itextpdf.text.BadElementException;
import com.itextpdf.text.Image;
import com.itextpdf.text.pdf.codec.Base64;
import com.itextpdf.tool.xml.net.exc.NoImageException;
import com.itextpdf.tool.xml.pipeline.html.ImageProvider;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @author redlab_b
 *
 */
public class ImageRetrieve {
    final static Pattern INLINE_PATTERN = Pattern.compile("^/data:image/(png|jpg|gif);base64,(.*)");
    private final ImageProvider provider;
    /**
     * @param imageProvider the provider to use.
     *
     */
    public ImageRetrieve(final ImageProvider imageProvider) {
        this.provider = imageProvider;
    }
    /**
     *
     */
    public ImageRetrieve() {
        this.provider = null;
    }
    /**
     * @param src an URI that can be used to retrieve an image
     * @return an iText Image object
     * @throws NoImageException if there is no image
     * @throws IOException if an IOException occurred
     */
    public com.itextpdf.text.Image retrieveImage(final String src) throws NoImageException, IOException {
        com.itextpdf.text.Image img = null;
        if (null != provider) {
            img = provider.retrieve(src);
        }
        if (null == img) {
            String path = null;
            if (src.startsWith("http")) {
                // full url available
                path = src;
            } else if (null != provider){
                String root = this.provider.getImageRootPath();
                if (null != root) {
                    if (root.endsWith("/") && src.startsWith("/")) {
                        root = root.substring(0, root.length() - 1);
                    }
                    path = root + src;
                }
            } else {
                path = src;
            }
            if (null != path) {
                try {
                  Matcher m;
                    if (path.startsWith("http")) {
                        img = com.itextpdf.text.Image.getInstance(path);
                    } else if ((m = INLINE_PATTERN.matcher(path)).matches()) {
                      // Let's handle the embedded image without saving it
                      try {
                        byte[] data = Base64.decode(m.group(2));
                        return Image.getInstance(data);
                      } catch (Exception ex) {
                        throw new NoImageException(src, ex);
                      }
                    } else {
                        img = com.itextpdf.text.Image.getInstance(new File(path).toURI().toURL());
                    }
                    if (null != provider && null != img) {
                        provider.store( src, img);
                    }
                } catch (BadElementException e) {
                    throw new NoImageException(src, e);
                } catch (MalformedURLException e) {
                    throw new NoImageException(src, e);
                }
            } else {
                throw new NoImageException(src);
            }
        }
        return img;
    }

}

你问这个问题已经快一年了,但也许这个答案无论如何都会有所帮助。

最近我遇到了类似的问题。我的目标是在生成的pdf中包含一个存储在数据库中的图像。

为此,我扩展了com.itextpdf.tool.xml.pipeline.html.AbstractImageProvider类并覆盖了它的retrieve()方法,如下所示:

public class MyImageProvider extends AbstractImageProvider {
  @Override
  public Image retrieve(final String src) {
    Image img = super.retrieve(src);
    if (img == null) {
      try {
        byte [] data = getMyImageSomehow(src);
        img = Image.getInstance(data);
        super.store(src, img);
      }
      catch (Exception e) {
        //handle exceptions
      }
    }
    return img;
  }
  @Override
  public String getImageRootPath() {
    return "http://sampleurl/img";
  }
}

然后,在为XMLWorker[1]构建管道时,我将类的一个实例传递给上下文:

htmlPipelineContext.setImageProvider(new MyImageProvider());

现在,我们希望这应该奏效。但有一个陷阱!在xmlworker库的深处,这个htmlPipelineContext正在被克隆。在这个操作过程中,我们对ImageProvider的实现丢失了。这发生在HtmlPipelineContext的clone()方法内部。看看第274-280行(我参考5.4.4版本):

final String rootPath =  imageProvider.getImageRootPath();
newCtx.setImageProvider(new AbstractImageProvider() {
  public String getImageRootPath() {
    return rootPath;
  }
});

这甚至在HtmlPipelineContext.clone()的javadoc[2]:中有描述

创建此HtmlPipelineContext的克隆,该克隆仅包含初始值,而不包含内部值。请注意,当前上下文的状态不会复制到克隆中。只有像(…)ImageProvider(具有相同ImageRootPath的新AbstractImageProvider)、(…)这样的配置重要的东西才会被复制。

这不是很有趣吗?您得到的类是为了通过使其抽象来进行扩展而设计的,但最终发现,这个类只充当属性持有者。

我的解决方法:

public class MySpecialImageProviderAwareHtmlPipelineContext extends HtmlPipelineContext {
  MySpecialImageProviderAwareHtmlPipelineContext () {
    super(null);
  }
  public HtmlPipelineContext clone () {
    HtmlPipelineContext ctx = null;
    try {
      ctx = super.clone();
      ctx.setImageProvider(new MyImageProvider());
    } catch (Exception e) {
      //handle exception
    }
    return ctx;
  }
}

然后我只使用这个而不是HtmlPipelineContext。


[1]http://demo.itextsupport.com/xmlworker/itextdoc/flatsite.html#itextdoc-菜单-7

[2]http://api.itextpdf.com/xml/com/itextpdf/tool/xml/pipeline/html/HtmlPipelineContext.html#clone()

希望您的解决方案在以后的版本(至少5.5.6)中被采用。

最新更新