如何使用JSDOM Nodejs提取这两个分页符之间的内容



html image使用JsDom如何在分页符之间提取内容?想要获得之间的所有内容。。。

您可以使用regex获取标记之间的内容,例如:

const dom = new JSDOM(``, {
url: "https://example.org/",
referrer: "https://example.com/",
contentType: "text/html",
includeNodeLocations: true,
storageQuota: 10000000
});
var bodyhtml = dom.window.document.body.innerHTML;
const regexp = /<span epub:type="pagebreak" .+></span>(.*)<p>.+</span>/gms;
var content = bodyhtml.matchAll(regexp);
console.log([...content]);

最新更新