我知道这可能是一个非常愚蠢的问题,但是,由于我对Javascript完全陌生,我不确定如何做到这一点。我想编写一个脚本并在笔记本电脑上通过node
运行它,在这个脚本中,我想与网页交互,以便使用document.getElementById
之类的功能。
在Python中,人们可以通过使用Beautiful Soup
或requests
之类的东西来做到这一点,但是如何在Javascript中做到这一点呢?
我已经使用cheerio和request-promise实现了一个爬虫,如下所示:
https://www.npmjs.com/package/cheerio
let request = require('request-promise');
let cheerio = require('cheerio');
request = request.defaults({
transform: function (body) {
return cheerio.load(body);
}
});
// ... omitted
request({uri: 'http://example.org'})
.then($ => {
const element = $('.element-with-class');
});