使用jsr223预处理器从pdf文件中提取文本



如何在JMeter中使用JSR223预处理器提取pdf文件的文本/内容?

您将需要一个像PDFBox这样的库来完成这个

  1. 将它和它的所有依赖项添加到JMeter类路径

  2. 重启JMeter获取.jar文件

  3. 从PDF中读取文本的最简单的代码是:

    def doc = org.apache.pdfbox.pdmodel.PDDocument.load(new File('path-to-the-file.pdf'))
    def text = new org.apache.pdfbox.text.PDFTextStripper().getText(doc)
    //now do what you need with the text, i.e. save it into ${text} JMeter variable
    vars.put('text', text)
    

更多信息:

  • Apache Groovy: Groovy是用来做什么的?
  • Apache PDFBox Cookbook - Text Extraction

相关内容

  • 没有找到相关文章