尝试刮擦React网站时获取index.html内容



当我尝试使用nodejs刮擦reactjs网站时,我将获得index.html文件的内容。这是我尝试的 -

    const request = require("request");
    const cheerio = require("cheerio");
    const URL = "https://pydata-jal.netlify.com/";
    request(URL, (err, res, body) => {
      if (!err && res.statusCode == 200) {
        const $ = cheerio.load(body);
        console.log($.html());
      }
    });

我该怎么做才能获取React网站中使用的全部标签。

告诉我可以刮擦Hackernoon网站?(例如(如果合法?

Cheerio解析仅渲染HTML(例如:静态HTML(为了获得React渲染,您应该依靠由Puppeteer等工具控制的无头浏览器

最新更新