在 css 文件中抓取 css 文件导入的 url,然后在 Python 中删除它们



我需要抓取 css 文件中的所有 css 导入(urls(。 示例为:

@import url("/pub-assets/css/index/tac-holidaysale.css");
@import url("/pub-assets/css/index/tc1200-fonts.css");
@import url("/pub-assets/css/index/ad-banner.css");

所以我需要得到一个列表,其中包括:

/pub-assets/css/index/tac-holidaysale.css
/pub-assets/css/index/tc1200-fonts.css
/pub-assets/css/index/ad-banner.css

我需要这个来缩小 Css。在我抓取了所有网址后,我需要删除所有这些导入。我怎样才能只在 Python 中做到这一点?

这是一些假设,但您可以在报价上拆分,然后只获取报价之间的项目。

所以你的代码看起来像这样:

rules = []
with open("test.css") as f:
    for line in f:
        if line.startswith("@import"):
            url = line.split('"')[1] # split on quote mark and get middle item
            rules.append(url)

这假定该行以 @import 开头,并且字符串中只有一对引号。让我知道这些假设是否太深远。

要删除 URL,您可以执行 line.replace(url,''(,或添加 line.split('"'( 的第 0 项和第 2 项

最新更新