使用导入 XML 和脚本存储从网站抓取的数据



我尝试每天使用Google表格从网站抓取一次数据,然后用脚本将其存储在一侧。我是新手,所以我似乎无法让它工作......这是我用来从网站抓取数据的方法:

=importxml("https://www.reddit.com/top/", "//div [@data-rank='1']")

然后我想将结果存储在某个地方...我想有附录?但它不断给我错误,我不知道如何解决它。到目前为止,我的脚本看起来像这样(但它出错了(:

function addData() {
var sheet = SpreadsheetApp.getActiveSheet();
sheet.appendRow(['=importXML("https://www.reddit.com/top/", "//div [@data-rank='1']")']);
}

还想添加提取数据的日期。

试试这个。您可以设置每日定时触发器来运行它。在脚本编辑器中,转到编辑菜单。单击当前项目触发器 为存档添加新触发器。定时触发器,每天,选择要运行和保存的时间。

function Archive() {
  var ss = SpreadsheetApp.getActiveSpreadsheet();
  var s1=ss.getSheetByName("Sheet1")//sheet with imported data
  var s2=ss.getSheetByName("Sheet2")//archive sheet
  var lr=s2.getLastRow()+1//get last row of archive sheet + 1
  var data=s1.getRange(2,1,1,4).getValues()//get sheet 1 values
  s2.getRange(lr,1,1,1).setValue(new Date())//create date and set in 
  s2.getRange(lr, 2, 1, 4).setValues(data)//set copy of data
}

最新更新