小贝子编程

数据库驱动抓取中的Python多进程/多线程

本文关键字：Python 多进程多线程抓取数据库 python multithreading multiprocessing
更新时间 : 2023-09-23
英文 : Python multiprocess/multithreading in database driven scraping

我在我的数据库中有大约7 lacs网站的url。我只是从那个网站上抓取了一些简短的信息。

但是当我运行脚本时，花大量时间检查如此庞大的url是正常的。

当前，我正在做for循环:

def scrape_short_webinfo():
# a function scraping some minor data
for instance in Link.objects.all():
scrape_short_webinfo(instance.url)

我想把这些东西放在多进程/多线程，这样它的脚本应该完成得更快。

在这种情况下有人能帮我吗?

你可以使用ExecutorService来并行化你的代码

最新更新

实现客户端流到服务器Python代码失败
DllNotFoundException: agoraSdkCWrapper with Agora in Unity o
Rust narray:按列顺序遍历数组
如何加载存储在同一DAT文件中的多个python对象?
代理跨域请求与angular——proxy.config
属性错误："函数"对象没有属性"args"
OpenGL/glm显示黑屏
我收到此警告标志数组索引 4001 已超过数组的末尾(包含 4001 个元素)
Spring Content 1.2.5 JPA(Postgres) .docx文件突变为zip归档
将十进制转换为十六进制，并确保它们是数字
为用户在登录页面后添加路由
动态变量导致错误，因为它没有正确分配
有可能从手机中获得指纹或人脸验证吗?
File IO From a JAR File
如何获得上下文在一个简单的类没有BuildContext在扑动
无法向 Tkinter 窗口添加背景
如何将RGB图像转换为灰度，但保持一种颜色?——Java
我应该在Docker内部还是在虚拟环境中安装气流?
属性错误： 'DataFrame'对象没有属性'assign'
如何在每次在DirectoryInfo.GetFiles()中加载新文件时执行操作?
HTML中的Javascript在Angular中不起作用
如何在firebase中调度大约每整小时运行一次的函数?
Uncaught TypeError:不能访问数组上字符串类型的偏移量
Switch(Select)在TRANSFORM和Select之间工作吗?
MySQL SELECT查询工作，但具有相同WHERE子句的UPDATE查询不工作
drupal 10 localhost站点:如何在安装和注销后访问登录页面
Flutter原生启动画面图像未出现- Flutter (Dart)
用另一个远程分支覆盖一个远程分支
邮递员说"The route api...could not be found."(拉拉维尔)
Firebase Messaging项目Google Analytics升级失败

数据库驱动抓取中的Python多进程/多线程

相关内容

最新更新

热门标签：