当我尝试使用nodejs刮擦reactjs网站时,我将获得index.html文件的内容。这是我尝试的 -
const request = require("request");
const cheerio = require("cheerio");
const URL = "https://pydata-jal.netlify.com/";
request(URL, (err, res, body) => {
if (!err && res.statusCode == 200) {
const $ = cheerio.load(body);
console.log($.html());
}
});
我该怎么做才能获取React网站中使用的全部标签。
告诉我可以刮擦Hackernoon网站?(例如(如果合法?
Cheerio解析仅渲染HTML(例如:静态HTML(为了获得React渲染,您应该依靠由Puppeteer等工具控制的无头浏览器