如何在JMeter中使用JSR223预处理器提取pdf文件的文本/内容?
您将需要一个像PDFBox这样的库来完成这个
-
将它和它的所有依赖项添加到JMeter类路径
-
重启JMeter获取.jar文件
-
从PDF中读取文本的最简单的代码是:
def doc = org.apache.pdfbox.pdmodel.PDDocument.load(new File('path-to-the-file.pdf')) def text = new org.apache.pdfbox.text.PDFTextStripper().getText(doc) //now do what you need with the text, i.e. save it into ${text} JMeter variable vars.put('text', text)
更多信息:
- Apache Groovy: Groovy是用来做什么的?
- Apache PDFBox Cookbook - Text Extraction