Python-删除不需要的字符串部分,获得特定的字符串



今天我想使用YouTube RSS Feed来通知我有关新视频的信息。所以现在一切都正常了,但我想得到一个特定的字符串,并想删除在我的特定字符串之后和之前的所有文本部分。那么,我该怎么做呢?我想我可以使用.partition和.split,但不知道如何使用它来解决我的问题。

因此,XML描述包含以下内容:

Quellen: https://sites.google.com/view/sources...​
Das Leben zu begreifen ist ziemlich schwierig, weil du immer mittendrin steckst. Es ist, als wolltest du herausfinden wie groß der Ozean ist, während du darin schwimmst. Meistens bist du damit beschäftigt, dich über Wasser zu halten. Es ist also gar nicht so einfach, herauszufinden, was du mit deinem Leben machen und wie du deine Zeit einsetzen willst.
Soundcloud: http://bitlylink
Facebook: http://bitlylink
Twitter: http://bitlylink
Instagram: http://bitlylink​

我想去掉第一行";奎伦:"以及描述底部的社交媒体链接。我只想把长线当作绳子。

重要的是要知道;QUELLEN";URL确实会随着每个视频而改变。但它始终是同一个站点:https://sites.google.com

那么,如何从描述中删除除长行之外的所有部分?

尝试split("n")

content = """Quellen: https://sites.google.com/view/sources...​
Das Leben zu begreifen ist ziemlich schwierig, weil du immer mittendrin steckst. Es ist, als wolltest du herausfinden wie groß der Ozean ist, während du darin schwimmst. Meistens bist du damit beschäftigt, dich über Wasser zu halten. Es ist also gar nicht so einfach, herauszufinden, was du mit deinem Leben machen und wie du deine Zeit einsetzen willst.
Soundcloud: http://bitlylink
Facebook: http://bitlylink
Twitter: http://bitlylink
Instagram: http://bitlylink​"""
description = content.split("n")[2]
print(description)

为了做你想做的事,我相信你需要找到一些模式。我不确定你的数据会是什么样子,但你可以尝试这样的东西:

description = 'n'.join([line for line in long_str.split('n') if ': http' not in line and line != ''])
print(description)

这也解释了描述中"\n"的存在

在我看来,你只想使用特定的行:

f = open('your_file_name')
lines = f.readlines()
print(lines[3])

最新更新