我有一个巨大的panda表,有很多行和列。我想提取所有包含特定字符串的单元格,并创建一个仅包含这些单元格的新表。关于如何处理这个问题,有什么想法吗?
谢谢!
你的意思是这样的吗?
import pandas as pd
df1 = pd.DataFrame([
{'a': 'sky is blue', 'b': 7},
{'a': 'fire is red', 'b': 9},
{'a': 'water is blue', 'b': 8},
])
df2 = df1.loc[df1.a.str.contains('blue'), :]
# df2 is now:
#
# a b
# 0 sky is blue 7
# 2 water is blue 8