我有一个巨大的excel,我已经使用熊猫导入。我想知道如何过滤有字符串'ABCD'的记录
我需要通过忽略中间的所有字符来过滤那些具有'ABCD'的记录。假设我有这样一个数据框。Col_2是包含'ABCD'
的列col_1 col_2 col_3 col_4
1 ABCD 123 890
2 AB/CD 345 789
3 XYZ 777 980
4 AB_CD 010 345
新的数据框架应该是
col_1 col_2 col_3 col_4
1 ABCD 123 890
2 AB/CD 345 789
3 AB_CD 010 345
尝试使用loc
和str.replace
:
print(df.loc[df['col_2'].str.replace('[^ABCD]', '').eq('ABCD')])
输出:
col_1 col_2 col_3 col_4
0 1 ABCD 123 890
1 2 AB/CD 345 789
3 4 AB_CD 10 345