如何在熊猫的数据["列"]中的"字符串"等条件下应用



我有Netflix节目的数据集。我想基于以下条件过滤记录:

data.loc[(data.type=='Movie') & (data.genre=='Action') & ('taxi' in str(data.description))]

上面的命令没有语法错误,但是它没有按照我的假设工作。

导致问题的条件是:

('taxi' in str(data.description)

您似乎想要Series.str.contains

data.loc[(data.type == 'Movie') & (data.genre == 'Action') & data.description.str.contains('taxi')]

要理解为什么你的代码不能运行,先检查print(str(data.description))的输出。它产生了什么?print('taxi' in str(data.description))的输出是多少?你明白发生了什么吗?

试试这个:

data.loc[(data.type=='Movie') & (data.genre=='Action') & (data.description.str.contains('taxi')}]

最新更新