基于列标题的新数据框架



我有一个600+列的大数据框架

其中大约有40个会有"奥地利"这个词。如果我正在为奥地利数据创建一个新的数据框架,是否有一种简单的方法来创建一个基于列标题的新数据框架?

任何帮助都非常感谢,由于

您可以使用filter:

df2 = df.filter(regex='(?i)austria')  # (?i) makes the search case insensitive

的例子:

df = pd.DataFrame(columns=['austria something', 'something austria',
'another austria', 'unrelated', 'Austria again'],
index=[0])
df.filter(regex='(?i)austria')
输出:

austria something something austria another austria Austria again
0               NaN               NaN             NaN           NaN

另一种使用.loc的方法,允许您在特定索引和.str.contains之间使用布尔值进行过滤

df2 = df.loc[:,df.columns.str.contains('austria',case=False)]
austria something something austria another austria Austria again
0               NaN               NaN             NaN           NaN

最新更新