什么'让需求直接指向git存储库而不是PyPi的优势是什么



最近我问一位Python库维护人员,他是否可以将其库的新标记版本上传到PyPI(https://pypi.org/)。他指出PyPI如今已经不那么重要了[1]。

是真的吗?人们(即你(确实倾向于不使用PyPI吗?如果是,你用什么代替?为什么?

requirements.txt显然允许您直接指定git存储库,直接使用git+https://github.com/<repo>跳过PyPI。尽管我想不出比使用PyPI有什么特别的优势。

有任何图表支持这一说法吗?如果这句话是真的,我预计PyPI的下载量(每个间隔(会随着时间的推移而减少。PyPI将这类数据发布到Google BigQuery。现在检查,下载次数如下:

202009    1565855136 -- the query was run on 11th of September 2020
202008    5155068175
202007    5409386519
202006    5211181171
202005    5108756961
202004    4812648839
202003    4670947975    
202002    4067963794
202001    4155726766
201912    3867376444
201911    3845881964
201910    3922992929
201909    3492788322    
201908    3374679723
201907    3338326277
201906    2998812162    
201905    3028973146
201904    2436032402
201903    2732697164

使用此查询获得:

SELECT
SUBSTR(_TABLE_SUFFIX, 1, 6) AS `month`,
COUNT(1) AS num_downloads
FROM `the-psf.pypi.downloads*`
WHERE
_TABLE_SUFFIX BETWEEN FORMAT_DATE(
'%Y%m01', DATE_SUB(CURRENT_DATE(), INTERVAL 18 MONTH))
AND FORMAT_DATE('%Y%m%d', CURRENT_DATE())
GROUP BY `month`
ORDER BY `month` DESC

我知道这个问题可能没有正确的答案,因此可能没有遵循StackOverflow上提出的所有问题标准。然而,我想不出比这更好的地方了。

[1]https://github.com/lavr/python-emails/issues/139

PyPI现在不那么重要了这是真的吗?

一点也不。在PyPI:上发布的优势

  1. 可以在PyPI上发布轮子,以便pip install package下载特定于平台的轮子。

  2. PyPI托管在CDN(内容交付网络(上,因此从PyPI下载速度很快。

3a。pip缓存下载的包,因此不会为每个虚拟环境重新下载包。它通过原始URL进行缓存,PyPI的URL是稳定的。

3b。pip缓存克隆的存储库非常糟糕。通常它会重新克隆整个存储库。

最新更新