我有一个600+列的大数据框架
其中大约有40个会有"奥地利"这个词。如果我正在为奥地利数据创建一个新的数据框架,是否有一种简单的方法来创建一个基于列标题的新数据框架?
任何帮助都非常感谢,由于
您可以使用filter
:
df2 = df.filter(regex='(?i)austria') # (?i) makes the search case insensitive
的例子:
df = pd.DataFrame(columns=['austria something', 'something austria',
'another austria', 'unrelated', 'Austria again'],
index=[0])
df.filter(regex='(?i)austria')
输出:austria something something austria another austria Austria again
0 NaN NaN NaN NaN
另一种使用.loc
的方法,允许您在特定索引和.str.contains
之间使用布尔值进行过滤
df2 = df.loc[:,df.columns.str.contains('austria',case=False)]
austria something something austria another austria Austria again
0 NaN NaN NaN NaN