我有一个名为spider
的函数,它将seed
作为参数。seed
是我发送给spider函数的URL的名称。现在我的问题是如何在Python中使用beanstalkc来对URL进行排队并执行作业。
根据您需要的教程:
- beanstalkd服务器正在运行
-
连接:
import beanstalkc beanstalk = beanstalkc.Connection(host='localhost', port=14711)
-
添加作业使用:
beanstalk.put('seed url')
-
获取工作通过:
job = beanstalk.reserve() spider(job.body)
-
将作业标记为已完成:
job.delete()