在Python上扩展缩短URL的更快方法



我正在使用以下代码来扩展一个非常大的数据帧的一列中的缩短URL。它非常慢。我怎样才能以更有效的方式做同样的事情?

谢谢!

这是我的代码:

from __future__ import absolute_import
import requests
trib=df[df['url'].str.contains('https://trib.al/',na=False)]
expand=trib['url'].tolist()
for trib in expand:
r = requests.get(trib)
df['url']=df['url'].str.replace(trib, r.url, regex=False)

查看您的代码,我认为没有太大的改进余地。您可以将for循环封装到一个函数中,并使用pd.Series.apply在代码中进一步提高速度,但我猜速度较慢的部分是请求,因为它需要通过互联网。您可以使用多处理并行化请求,从而更快地完成列表。但是,在这里,您必须小心不要并行发送多个请求,因为如果导致服务器负载过大,您可能会被阻止。

最新更新