如何在Python中使用beanstalkc对URL进行排队并执行作业



我有一个名为spider的函数,它将seed作为参数。seed是我发送给spider函数的URL的名称。现在我的问题是如何在Python中使用beanstalkc来对URL进行排队并执行作业。

根据您需要的教程:

  1. beanstalkd服务器正在运行
  2. 连接:

    import beanstalkc
    beanstalk = beanstalkc.Connection(host='localhost', port=14711)
    
  3. 添加作业使用:

    beanstalk.put('seed url')
    
  4. 获取工作通过:

    job = beanstalk.reserve()
    spider(job.body)
    
  5. 将作业标记为已完成:

    job.delete()
    

相关内容

  • 没有找到相关文章

最新更新