如何跳过/删除行，直到某个字符串

我正在阅读这个csv从url (https://www.cboe.com/available_weeklys/get_csv_download/)。我的问题是如何跳过所有行到字符串"可用周-交易所交易产品(etf和etn)"。然而，它并不像skiprows=15那么简单。我不能简单地跳过一定数量的行，因为字符串之前的行数在将来会发生变化，所以我需要使用字符串作为停止点。谢谢你！

我们可以将文件的内容读入字符串，计算换行数，直到遇到搜索字符串，并使用该计数动态跳过所需的行数。

import requests
# read contents of link into string variable
link = 'https://www.cboe.com/available_weeklys/get_csv_download/'
output = requests.get(link).text

find_str = "Available Weeklys - Exchange Traded Products (ETFs and ETNs)"
# find index of search string in output
idx = output.find(find_str)
# Count number of newlines until search string is encountered
skiprows_val = output[:idx+len(find_str)].count("n")
print(skiprows_val)
df = pd.read_csv(link, skiprows = skiprows_val)
df

相关内容

最新更新

热门标签：